Průzkumné studie rozhodnout, zda a jak pokračovat s full-stupnice hodnocení opatření v oblasti veřejného zdraví: systematický přehled poradenství | Pilot a Studie Proveditelnosti

Recenze statistiky

Čtyři tisíce devadesát-pět unikátních záznamů byly identifikovány, z nichž 93 byly přezkoumány v plném znění (viz Obr. 1). Celkem bylo do systematického přezkumu zahrnuto 30 dokumentů představujících 25 jedinečných sad pokynů., Většina zdrojů vedení výslovně neidentifikovala zamýšlené publikum a pokyny se lišily v jeho významu pro veřejné zdraví. Tabulka 2 uvádí přehled všech zdrojů pokyny zahrnuty v recenzi se zdroji vedením více či méně relevantní pro veřejné zdraví identifikovány, stejně jako ty, které se vztahují především k průzkumné studie randomizované designu.

Tabulka 2 Souhrn zahrnuty pokyny

Zjištění z vedení

součástí vedení uvádí širokou škálu doporučení na proces provádění a vykazování výzkumné studie., Jsme rozděleny do osmi témat, které zachycují: předpoklady pro provedení explorační studie, názvosloví, pokyny pro posouzení zásahu, pokyny okolní budoucnosti hodnotící studie design, adaptivní vs tuhé návrhy, vývoj kritérií pro explorativní studie, zapojení zúčastněných stran a podávání zpráv.,

Vyprávění, popis témata

Téma 1: předpoklady pro provedení explorační studie

Kde bylo uvedeno, předpokladem činnosti zahrnuty určení datové základny, založení teoretický základ pro zásah, určení zásah složek, stejně jako modelování intervence s cílem pochopit, jak intervence komponenty komunikovat a dopad na konečné výsledky . Často se o nich diskutovalo v rámci cyklu hodnocení intervenčního vývoje a hodnocení MRC ., Bylo také zdůrazněno pochopení toho, jak intervenční komponenty interagují s různými kontextovými nastaveními a identifikují nezamýšlené škody, jakož i potenciální problémy s implementací. Při posuzování těchto výše uvedených podmínek byla neexistence podrobností dostatečně splněna pro přechod na průzkumnou studii.

téma 2: nomenklatura

široká škála termínů byla použita, někdy zaměnitelně, k popisu průzkumných studií s nejběžnější pilotní studií/studií. Tabulka 3 ukazuje četnost pojmů používaných v pokynech, včetně dalších schválených termínů.,

Tabulka 3 Četnost nomenklatury používané

Různé terminologie neprokázalo, že by být trvale spojena s konkrétní studijní účely (viz téma 3), jak je znázorněno v Tabulce 2. ‚Pilot‘ a ‚proveditelnosti studie byly někdy používány zaměnitelně, zatímco jiní dělal rozdíly mezi oběma podle designu, funkce nebo konkrétní cíl ., Například, některé popsané pilotní studie jako menší verze budoucího RCT běžet v miniatuře a byl někdy spojován s randomizovaným designem, ale ne vždy . Naproti tomu studie proveditelnosti byly použity jako zastřešující termín Eldridge et al. s pilotní studie představuje podmnožinu studie proveditelnosti : ‚Jsme naznačují, že vědci pohledu proveditelnosti jako zastřešující pojem, se všechny studie provedené v rámci přípravy na hlavní studie, otevřít se, že tzv. studie proveditelnosti a pilotní studie jako podmnožina studie proveditelnosti.“(s. 18).,

studie proveditelnosti by se mohly zaměřit na konkrétní Intervenční a zkušební konstrukční prvky, které nemusí zahrnovat randomizaci . Interní pilotní studie byly primárně vnímány jako součást celého procesu, a proto nejsou uvedeny v nomenklatuře v tabulce 3.

Zatímco žádné zdroje výslovně uvedeno, že explorativní studie by se měla zaměřit na jednu oblast a ne jiné, cíle a související metody výzkumné studie rozdělily do dvou samostatných témat. Týkaly se buď zkoumání samotného zásahu, nebo budoucího návrhu hodnocení, a jsou podrobně popsány níže v tématech 3 a 4.,

Téma 3: pokyny pro posouzení zásah

Zdroje závěrech výzkumných studií mají formativní účely (tj. rafinace intervence a řešení nejasností týkající se provádění zásahu ), stejně jako sumativní cíle (tj. posoudit potenciální dopad zásah nebo jeho slib ).

Rafinace intervence a základní teorie

Některé pokyny naznačil, že změny by mohly být provedeny v rámci průzkumné studie k upřesnění intervenci a základní teorie a přizpůsobit intervenci obsah nové nastavení ., Pokyny však nebyly jasné, co představovalo menší vs. hlavní změny a důsledky pro kritéria progrese (viz téma 6). Při provádění změn v intervenci nebo základní teorii to doporučilo některé pokyny v průběhu průzkumné studie (viz téma 5). Jiné zdůraznily úlohu pomocí multi-arm design vyberte obsah intervence, než plné hodnocení a posouzení možných mechanismů více různých zásahů nebo zásahů složek ., Několik zdrojů zdůrazněna úloha kvalitativního výzkumu ve optimalizaci nebo rafinace intervence, zejména pro pochopení komponent z logiky modelu a povrchové úpravy skryté aspekty intervence důležité pro dosahování výsledků .

implementace intervence

v široké škále pokynů byla shoda, že průzkumné studie by mohly prozkoumat klíčové nejistoty související s prováděním intervencí, jako je přijatelnost, proveditelnost nebo praktičnost. Zejména tyto pojmy byly často špatně definovány a používány zaměnitelně., Přijatelnost byl považován z hlediska příjemců reakce, zatímco jiní byli také pozorní k proveditelnosti z hlediska zásahu poskytovatele, doručovatelé a zdravotníků . Realizace, proveditelnost, věrnost a „praktičnost“ zkoumaly pravděpodobnost, že budou schopni v praxi dodat to, co bylo zamýšleno . Ty byly někdy označovány jako cíle v rámci vestavěného hodnocení procesu, které se uskutečnilo vedle průzkumné studie, ačkoli termín hodnocení procesu nebyl nikdy definován .,

kvalitativní výzkum byl podporován pro posouzení přijatelnosti intervencí nebo pro provádění (např. prostřednictvím nezúčastněného pozorování ). Byla doporučena opatrnost, pokud jde o zaostřovací skupiny, kde existuje riziko maskování odlišných názorů . Jiní doporučili kvantitativní průzkumy, aby prozkoumali retenční sazby a důvody výpadku. Navíc několik zdrojů, zdůraznil význam testování implementace v různých situacích —zejména v méně socioekonomicky znevýhodněných skupin, aby posoudila riziko prohlubující se nerovnosti v oblasti zdraví .,

Jeden zdroj vedení zvážit, zda randomizace byla nutná pro posouzení zásahu přijatelnosti, věřit, že je to zbytečné, ale také naznačuje, že by mohl potenciálně závisí na preferenci mezi zásahy nabídl v hlavním líčení‘ (; p. 9). Otázky přijatelnosti intervencí, zejména v rámci vícepramenných studií, se tedy mohou týkat klinické equipoise a přijatelnosti randomizačních postupů mezi účastníky .,

vhodnost posouzení intervenčního dopadu

několik zdrojů pokynů diskutovalo o potřebě porozumět dopadu zásahu, včetně škod, přínosů nebo nezamýšlených důsledků . Velká část pokynů se zaměřila na statistické testy účinnosti s nesouhlasem ohledně spolehlivosti tohoto cíle, i když byly doporučeny také kvalitativní metody . Někteří odsoudili statisticky testování účinnosti, protože takové studie jsou často nedostatečné, což vede k nepřesným a potenciálně zavádějícím odhadům velikostí efektů ., Jiní tvrdili, že odhad pravděpodobné, že velikost účinku může důkaz zásah byl funkční a ne mít vážné nezamýšlené škody, a tedy být použity pro výpočet výkonu za celý proces . Později vedení od MRC je více nejednoznačné, než dřívější vedení, s tím, že odhady by měly být interpretovány s opatrností, zatímco současně s uvedením „bezpečné“ předpoklady efekt velikosti jako pre-requisite pokračuje na plné hodnocení ., NIHR pokyny, které rozlišují mezi pilotní studie a studie proveditelnosti, podporované posouzení primární výsledek pilotní studie, i když není jasné, zda to naznačuje, že pilot by měl zahrnovat počáteční zkouška změny v primární výsledek, nebo prostě, že hlavním výsledkem by měly být měřeny stejným způsobem, jako by bylo v plném hodnocení. Naproti tomu u „studií proveditelnosti“ bylo uvedeno, že cílem může být návrh výsledného opatření, které má být použito v plném hodnocení.,

Další případ pro identifikaci důkazů potenciál účinnosti, včetně používání prozatímní nebo náhradní koncové body , definované jako ‚…proměnné na příčinnou cestu, co by se mohlo nakonec být primární výsledek v budoucí konečné RCT, nebo výsledků v časných časových bodech, aby bylo možné posoudit potenciál pro intervence vliv na pravděpodobné výsledky v budoucnosti definitivní RCT…‘ (str. 14).,

Randomizace bylo naznačeno jako designový prvek průzkumné studie při odhadu vliv velikost odhad zásahu jako je maximalizována pravděpodobnost, že pozorované rozdíly jsou vzhledem k zásahu , s pokyny většinou psány z výchozí předpoklad, že plné hodnocení bude mít formu RCT a poradenství zaměřené na průzkumné studie pro kvazi-experimentální nebo jiné návrhy., Pro studie, které mají za cíl zhodnotit potenciální efektivitu použití náhradní nebo prozatímní výsledek, za použití standardní velikosti vzorku výpočet bylo doporučeno zajistit dostatečnou sílu, i když bylo zjištěno, že tento cíl je vzácné ve výzkumných studiích .

Téma 4: pokyny obklopující budoucí hodnocení designu

Zdroje důsledně obhajoval posouzení proveditelnosti studie postupů nebo odhad parametrů budoucího hodnocení. Doporučení jsou podrobně popsána níže.,

posouzení proveditelnosti budoucího návrhu hodnocení

posouzení proveditelnosti budoucích hodnotících postupů bylo běžně doporučeno k odvrácení problémů, které by mohly narušit chování nebo přijatelnost budoucího hodnocení . Širokou škálu postupy byly navrženy tak, že vyžaduje posouzení proveditelnosti včetně sběru dat , účastník retenčních strategií , randomizace , metody náboru , běží na plné zkušební protokol , ochota účastníků randomizovaných a problémy kontaminace ., Tam byl spor o vhodnost posuzování oslepující v průzkumné studie , s jedním zdrojem zmínku dvojité zaslepení je těžké, když účastníkům jsou nápomocni ve změně jejich chování, i když hodnocení jeden oslepující může být možné .pro hodnocení těchto procesů byly schváleny kvalitativní , kvantitativní a smíšené metody

. Odráží tendence k vedení průzkumné studie, které mají být omezena na studium v rámci přípravy pro Rct, diskuse o roli randomizace v průzkumné fázi studií vystupoval silně ve vedení., Randomizace v rámci průzkumné studie bylo považováno za nezbytné pro posouzení proveditelnosti náboru, souhlasu, randomizace, uchovávání, kontaminace nebo údržbu oslepující v kontrolní a intervenční skupiny, randomizace a zda všechny součásti protokolu mohou pracovat společně, i když randomizace nebylo považováno za nutné posoudit výsledek zátěž a účastníka způsobilosti ., I když existovala shoda o tom, jaké otázky by mohly být posouzeny randomizací, zdroje se neshodly na tom, zda by randomizace měla vždy předcházet budoucí hodnotící studii, i když tato budoucí studie má být RCT. Zdálo se, že spor souvisí s odchylkami v nomenklatuře a souvisejícími cíli. Například, některé definice pilotní studie jako studie v miniaturní vyzkoušet, jak všechny jeho komponenty pracují společně, čímž diktovat randomizované designu . Pro studie proveditelnosti však byla randomizace nezbytná pouze tehdy, pokud snížila nejistotu při odhadu parametrů pro budoucí hodnocení ., Podobně jiné pokyny zdůraznily, že průzkumná studie (bez ohledu na nomenklaturu) by se měla zabývat hlavními nejistotami, a proto nemusí záviset na randomizaci .

Odhad parametrů budoucího hodnocení designu

Zatímco kvalitativní metody byly považovány za užitečné pro výběr výsledků a jejich vhodné opatření , většina vedení soustředěna na kvantitativní metody pro odhad budoucího hodnocení velikosti vzorku., To bylo sporné kvůli potenciálu příliš nebo nedostatečně odhadovaných velikostí vzorků požadovaných v budoucím hodnocení kvůli nedostatečné přesnosti odhadů od malého pilota . Odhad velikosti vzorku z odhadů velikosti účinku v průzkumné studii však někteří argumentovali, že jsou užitečné, pokud existuje nedostatečná literatura, a průzkumná studie použila stejný design a výsledek jako budoucí hodnocení . Klastrové RCT, které jsou běžné při intervencích v oblasti veřejného zdraví, byly specificky vyčleněny jako nevhodné pro odhad parametrů pro výpočty velikosti vzorku (např., clustery korelační koeficienty), stejně jako nábor a navazující sazby bez dalších informací z jiných zdrojů, protože velký počet shluků a jednotliví účastníci by bylo zapotřebí . Ostatní uvedené ‚nepsaným pravidlům‘ při určování velikosti vzorku v explorativní studie se čísla pohybují mezi 10 a 75 účastníků na soud ruku v individuálně randomizovaných studií ., Několik také doporučuje, že je třeba zvážit požadovanou významný rozdíl ve zdraví výsledků z hodnocení v budoucnosti a vhodné velikosti vzorku potřebné ke zjištění, spíše než provedení velikost vzorku výpočty pomocí odhadů pravděpodobností vliv velikosti od pilotní data .

randomizovaný návrh byl považován za zbytečný pro odhad nákladů nebo výběr výsledků, ačkoli byl oceněn pro odhad míry náboru a uchovávání intervenčních a kontrolních skupin ., Tam, kde vedení je uvedeno na odhad vliv velikosti vhodné informovat velikost vzorku pro budoucí hodnocení, randomizované designu bylo považováno za nutné .

téma 5: flexibilní vs. pevný design

zdroje uvedly, že průzkumné studie by mohly využívat tuhý nebo flexibilní design. S posledně uvedeným se návrh může v průběhu studie změnit, což je užitečné pro provedení změn zásahu, stejně jako budoucí návrh hodnocení ., Zde lze kvalitativní údaje analyzovat, jak jsou shromažďovány, formovat průzkumný studijní proces, například odběr vzorků následných bodů sběru dat, a objasnění důsledků pro účinnost intervence .

naproti tomu byly podporovány pevné průzkumné studie, které primárně zkoumaly budoucí hodnotící parametry a procesy . Může se stát, že nomenklatuře použité v některé pokyny (např. pilotní studie, které jsou popsány jako miniaturní verze hodnocení) navrhuje rozlišovat mezi více flexibilní vs. přísnější vzory., V některých vedení, to nebylo uvedeno, zda by měly být provedeny změny v průběhu průzkumné studie nebo později, s cílem získat co nejlepší design pro budoucí hodnocení .

Téma 6: vývoj kritérií pro budoucí hodnotící studie

Malý pokyny byly uvedeny na to, co je třeba zvážit při formulování progrese kritéria pro pokračování na budoucí hodnotící studie., Někteří se zaměřili na relevantní nejistoty proveditelnosti , zatímco jiní zdůrazňují konkrétní položky týkající se efektivity nákladů, upřesňují kauzální hypotézy, které mají být testovány v budoucím hodnocení a splňují cíle náboru . Jak je popsáno v tématech, 3 a 4 statisticky testování účinnosti a pomocí efektu velikosti pro výpočet výkonu byl upozorňují někteří, a tak kritéria, na základě vliv velikosti nebyly specifikovány .

Větší diskuse byla věnována tomu, jak váhu důkazů z průzkumné studie, která se zabývala více cíle a používají různé metody., Některé výslovně uvedeno progrese kritéria by neměla být posuzována jako přísné limity, ale jako pokyny pro použití, například, semafory systému s různou úrovní přijatelnosti . Jiní zdůraznili realistický přístup, odklon od binárních ukazatelů k zaměření na „co je proveditelné a přijatelné pro koho a za jakých okolností“. S ohledem na obtíže kolem výklad efekt odhady, několik zdrojů doporučené kvalitativní zjištění z výzkumných studií by měla být vlivnější než kvantitativní zjištění .,

zajímavé je, že došlo k nejasnostem ohledně progrese, když průzkumné nálezy naznačovaly podstatné změny v návrhu intervence nebo hodnocení. Zdroje s ohledem na tento problém navrhl, že v případě rozsáhlé změny „nebo“ hlavní změny jsou provedeny buď (všimněte si, že neuvedl, co se kvalifikoval jako takové), výzkumníci by se měl vrátit do průzkumné nebo intervence fázích vývoje .,

‚Případně v realizační fázi, mohou vědci identifikovat základní problémy s intervenci nebo hodnocení chování a vrátit se k fázi vývoje, spíše než přistoupit k soudu.“(s. 1).

jak bylo popsáno výše, nicméně prahová hodnota, při které jsou změny určeny jako „hlavní“, zůstala nejednoznačná., Zatímco aktualizováno MRC vedení se stěhoval do více iterativní model, připouští, že pohyb zpět mezi proveditelnosti/pilotní a rozvojové intervence může být někdy potřeba, tam byl žádný návod na to, za jakých podmínek pohyb mezi tyto dvě fáze by měla probíhat.

téma 7: zapojení zúčastněných stran

několik zdrojů doporučilo řadu zúčastněných stran (např., intervence poskytovatelů intervenčních příjemci, zástupci veřejnosti, stejně jako odborníkům, kteří by mohli použít důkazů, které celý proces) být zapojeny do plánování a chodu průzkumné studie na zajištění výzkumné studie odrážejí realitu intervence nastavení . Zejména byly doporučeny participativní přístupy založené na komunitě ., Zatímco mnoho zvýrazněné hodnoty zúčastněných stran na Procesu Řízení Výborů a jiných podobných studijních skupin , některé varoval rovnováha mezi vědci a zúčastněnými stranami a také varoval před vědci narážím na zapojení zúčastněných stran s kvalitativní výzkum .

i když pacient a zástupce veřejné správy na výzkumné týmy mohou poskytnout užitečnou zpětnou vazbu o zásahu, nejedná se o kvalitativní výzkum a nemusí mít za následek dostatečně robustní data informovat příslušné rozvojové intervence.“(s. 8).,

téma 8: podávání zpráv o průzkumných studiích

podrobná doporučení pro podávání zpráv o průzkumných studiích byla nedávno poskytnuta v nových konsolidovaných standardech pokynů pro podávání zpráv Eldridge et al. . Kromě toho byly opakující se body vychovávány jinými zdroji vedení. Nejvíce pozoruhodně, to bylo doporučeno průzkumné studie publikované v recenzovaných časopisech, protože to může poskytnout užitečné informace pro ostatní vědci na to, co bylo uděláno, co nefungovalo a co by mohlo být nejvhodnější ., Průzkumná studie může také vést k více publikacím, ale měla by poskytnout odkaz na jiné práce provedené ve stejné průzkumné studii . Několik zdrojů z vedení také zdůraznit, že výzkumné studie by měly být vhodně označeny v názvu/abstraktu umožnit snadnou identifikaci; nicméně, názvosloví navrhl měnit v závislosti na vedení .

Madame Lelica