Badania rozpoznawcze mające na celu podjęcie decyzji, czy i w jaki sposób przeprowadzić pełną ocenę interwencji w dziedzinie zdrowia publicznego: systematyczny przegląd wytycznych | studiów pilotażowych i studiów wykonalności

statystyki przeglądu

zidentyfikowano cztery tysiące dziewięćdziesiąt pięć unikalnych rekordów, z których 93 zostały poddane przeglądowi w pełnym tekście (patrz Rys. 1). W sumie do systematycznego przeglądu włączono 30 dokumentów reprezentujących 25 unikalnych zestawów wytycznych., Większość źródeł poradnictwa nie określiła wyraźnie docelowej grupy odbiorców, a poradnictwo różniło się pod względem znaczenia dla zdrowia publicznego. Tabela 2 przedstawia przegląd wszystkich źródeł wytycznych zawartych w przeglądzie wraz ze źródłami wytycznych mniej lub bardziej istotnymi dla zdrowia publicznego zidentyfikowanymi, jak również tymi, które miały szczególne zastosowanie do badań rozpoznawczych z randomizowanym projektem.

rys., 1

schemat przepływu

Tabela 2 streszczenie zawartych wytycznych

wnioski z wytycznych

zawarte wytyczne zawierały szereg zaleceń dotyczących procesu przeprowadzania i raportowania badań rozpoznawczych., Podzieliliśmy je na osiem tematów, które obejmują: wymagania wstępne do przeprowadzenia badania rozpoznawczego, nomenklaturę, wytyczne dotyczące oceny interwencji, wytyczne dotyczące przyszłego projektu badania oceniającego, projekty adaptacyjne i sztywne, kryteria progresji dla badań rozpoznawczych, zaangażowanie zainteresowanych stron i sprawozdawczość.,

opis tematyczny

Temat 1: Wymagania wstępne do przeprowadzenia badania rozpoznawczego

W przypadku, gdy wspomniano, działania wstępne obejmowały określenie podstawy dowodowej, ustalenie teoretycznej podstawy interwencji, identyfikację komponentów interwencji, a także modelowanie interwencji w celu zrozumienia, w jaki sposób komponenty interwencji współdziałają i wpływają na wyniki końcowe . Były one często omawiane w kontekście cyklu rozwoju i oceny interwencji MRC ., Podkreślono również, w jaki sposób komponenty interwencyjne wchodzą w interakcję z różnymi ustawieniami kontekstowymi oraz zidentyfikowano niezamierzone szkody, a także potencjalne problemy z wdrożeniem. Nie było szczegółów w ocenie, kiedy powyższe warunki zostały spełnione wystarczająco, aby przejść do badania rozpoznawczego.

Theme 2: nomenclature

do opisu badań eksploracyjnych używano wielu terminów, czasem zamiennie, z których najczęstszym było badanie / badanie pilotażowe. Tabela 3 przedstawia częstotliwość stosowania terminów stosowanych w wytycznych, w tym innych zatwierdzonych terminów.,

Tabela 3 częstotliwość stosowania nomenklatury

Inna terminologia nie wydaje się być konsekwentnie związana z konkretnymi celami badań (zob. motyw 3), Jak przedstawiono w tabeli 2. Badania „pilotażowe” i „wykonalności” były czasami stosowane zamiennie, podczas gdy inne dokonywały rozróżnienia między nimi w zależności od cech projektu lub konkretnych celów ., Na przykład niektórzy opisywali badania pilotażowe jako mniejszą wersję przyszłego RCT, która miała być prowadzona w miniaturze i czasami wiązała się z randomizowanym projektem , ale nie zawsze . W przeciwieństwie do tego, studia wykonalności zostały wykorzystane jako termin parasol przez Eldridge et al. z badań pilotażowych reprezentujących podzbiór studiów wykonalności: „sugerujemy, aby naukowcy postrzegali wykonalność jako nadrzędną koncepcję, przy czym wszystkie badania wykonane w ramach przygotowań do głównego studium mogą być nazywane studiami wykonalności, a badania pilotażowe jako podzbiór studiów wykonalności.”(s. 18).,

studia wykonalności mogłyby koncentrować się na konkretnych elementach projektu interwencji i prób, które mogą nie obejmować randomizacji . Wewnętrzne badania pilotażowe były przede wszystkim postrzegane jako część pełnego badania i dlatego nie są przedstawione w nomenklaturze w tabeli 3.

podczas gdy żadne źródła wyraźnie nie stwierdziły, że badanie rozpoznawcze powinno koncentrować się na jednym obszarze, a nie na drugim, cele i związane z nimi metody badań rozpoznawczych rozeszły się w dwóch oddzielnych tematach. Dotyczyły one zarówno samej interwencji, jak i przyszłego projektu oceny i zostały szczegółowo opisane poniżej w tematach 3 i 4.,

temat 3: wytyczne dotyczące oceny interwencji

Źródła wytycznych zatwierdzały badania rozpoznawcze mające cele kształtujące (tj. udoskonalenie interwencji i rozwiązanie problemów związanych z realizacją interwencji), jak również cele podsumowujące (tj. ocena potencjalnego wpływu interwencji lub jej obietnicy ).

Udoskonalenie interwencji i teorii leżącej u podstaw

niektóre wytyczne sugerowały, że w ramach badań eksploracyjnych można wprowadzić zmiany w celu udoskonalenia interwencji i teorii leżącej u podstaw oraz dostosowania treści interwencji do nowego otoczenia ., Jednak wytyczne nie były jasne, co stanowiło drobne a co najważniejsze zmiany i co miało wpływ na kryteria progresji (zob. motyw 6). Przy wprowadzaniu zmian do interwencji lub teorii leżącej u podstaw, niektóre wytyczne zalecały to w trakcie badania rozpoznawczego (patrz temat 5). Inne podkreśliły rolę wykorzystania wieloramiennego projektu do wyboru treści interwencji przed pełną oceną oraz do oceny potencjalnych mechanizmów wielu różnych interwencji lub elementów interwencji ., Niektóre źródła podkreślały rolę badań jakościowych w optymalizacji lub udoskonaleniu interwencji, szczególnie w celu zrozumienia elementów modelu logicznego i ujawnienia ukrytych aspektów interwencji ważnych dla osiągnięcia wyników .

realizacja interwencji

w szerokim zakresie wytycznych uzgodniono, że badania rozpoznawcze mogą badać kluczowe niepewności związane z realizacją interwencji, takie jak akceptowalność, wykonalność lub praktyczność. Szczególnie te terminy były często źle zdefiniowane i używane zamiennie., Akceptowalność rozważano pod względem reakcji odbiorców, podczas gdy inni zwracali również uwagę na wykonalność z punktu widzenia dostawców interwencji, dostawców i pracowników służby zdrowia . Wdrożenie, wykonalność, wierność i ” praktyczność „badały prawdopodobieństwo, że będą w stanie zrealizować w praktyce to, co zamierzano. Były one czasami określane jako cele w ramach wbudowanej oceny procesu, które miały miejsce obok badania rozpoznawczego, chociaż termin oceny procesu nigdy nie został zdefiniowany .,

zachęcano do prowadzenia badań jakościowych w celu oceny dopuszczalności interwencji lub ich realizacji (np. poprzez obserwację poza uczestnikiem ). Zaleca się ostrożność w odniesieniu do grup fokusowych, w których istnieje ryzyko maskowania rozbieżnych poglądów . Inni zalecali badania ilościowe w celu zbadania wskaźników retencji i przyczyn porzucenia . Ponadto w kilku źródłach podkreślono znaczenie testowania wdrożenia w różnych kontekstach —zwłaszcza w mniej uprzywilejowanych społecznie i ekonomicznie grupach, w celu zbadania ryzyka pogłębienia nierówności zdrowotnych .,

jedno ze źródeł wskazujących rozważało, czy randomizacja jest konieczna do oceny dopuszczalności interwencji, uważając, że jest to niepotrzebne, ale sugerując również, że może ona „potencjalnie zależeć od preferencji wśród interwencji oferowanych w badaniu głównym” (; s. 9). Tak więc kwestie dopuszczalności interwencji, szczególnie w ramach badań wieloramiennych, mogą odnosić się do równowagi klinicznej i dopuszczalności procedur randomizacji wśród uczestników .,

stosowność oceny wpływu interwencji

kilka źródeł wytycznych omawiało potrzebę zrozumienia wpływu interwencji, w tym szkód, korzyści lub niezamierzonych konsekwencji . Większość wytycznych koncentrowała się na statystycznych testach skuteczności, nie zgadzając się co do zasadności tego celu, chociaż zalecano również metody jakościowe . Niektóre potępione statystycznie testy skuteczności, ponieważ takie badania są często niedostatecznie prowadzone, co prowadzi do nieprecyzyjnych i potencjalnie wprowadzających w błąd oszacowań wielkości efektów ., Inni twierdzili, że oszacowanie prawdopodobnej wielkości efektu może świadczyć o tym, że interwencja działała zgodnie z przeznaczeniem i nie miała poważnych niezamierzonych szkód, a zatem może być wykorzystana do obliczenia mocy dla pełnego badania . Późniejsze wytyczne MRC są bardziej niejednoznaczne niż wcześniejsze wytyczne, stwierdzające, że szacunki powinny być interpretowane z ostrożnością, jednocześnie określając „bezpieczne” założenia wielkości skutków jako warunek wstępny przed kontynuowaniem pełnej oceny ., Wytyczne NIHR, które rozróżniły studia pilotażowe i studia wykonalności, wspierały ocenę pierwotnego wyniku w badaniach pilotażowych, chociaż nie jest jasne, czy sugeruje to, że pilot powinien obejmować wstępny test zmian w pierwotnym wyniku, czy po prostu, że pierwotny wynik powinien być mierzony w taki sam sposób, jak w pełnej ocenie. Natomiast w przypadku „studiów wykonalności” wskazano, że celem może być opracowanie środka końcowego, który będzie wykorzystany w pełnej ocenie.,

inni przedstawili argumenty przemawiające za identyfikacją dowodów potencjalnej skuteczności, w tym za zastosowaniem tymczasowych lub zastępczych punktów końcowych , zdefiniowanych jako „…zmienne na ścieżce przyczynowej tego, co może być ostatecznie pierwotnym wynikiem w przyszłym ostatecznym RCT, lub wyników we wczesnych punktach czasowych, w celu oceny potencjalnego wpływu interwencji na prawdopodobne wyniki w przyszłym ostatecznym RCT […] ” (s. 14).,

randomizacja została zasugerowana jako cecha projektowa badań eksploracyjnych przy szacowaniu oszacowania wielkości efektu interwencji , ponieważ zmaksymalizowała prawdopodobieństwo, że zaobserwowane różnice wynikają z interwencji, z wytycznymi w większości napisanymi z początkowego założenia, że pełna ocena przyjmie formę RCT, a wytyczne skupiały się mniej na badaniach eksploracyjnych dla quasi-eksperymentalnych lub innych projektów., W przypadku badań, które mają na celu ocenę potencjalnej skuteczności przy użyciu wyników zastępczych lub tymczasowych, zaleca się zastosowanie standardowego obliczenia wielkości próby w celu zapewnienia odpowiedniej mocy, chociaż zauważono, że cel ten jest rzadki w badaniach eksploracyjnych .

Temat 4: wytyczne dotyczące przyszłego projektu oceny

Źródła konsekwentnie zalecały ocenę wykonalności procedur badania lub szacowanie parametrów przyszłej oceny. Zalecenia są szczegółowe poniżej.,

ocena wykonalności przyszłego projektu oceny

ocena wykonalności przyszłych procedur oceny była powszechnie zalecana w celu uniknięcia problemów, które mogłyby podważyć przebieg lub akceptowalność przyszłej oceny . Zaproponowano szeroki zakres procedur wymagających oceny wykonalności, w tym gromadzenie danych , strategie zatrzymywania uczestników , randomizację , metody rekrutacji , prowadzenie pełnego protokołu prób, gotowość uczestników do randomizacji i kwestie zanieczyszczenia ., Nie było zgody co do zasadności oceny Oślepiania w badaniach rozpoznawczych , przy czym jedno ze źródeł zauważa, że podwójne oślepianie jest trudne, gdy uczestnikom pomaga się w zmianie ich zachowania; chociaż ocena pojedynczego Oślepiania może być możliwa .

zatwierdzono metody jakościowe , ilościowe i mieszane do oceny tych procesów. Odzwierciedlając tendencję do ograniczania przewodnictwa w badaniach eksploracyjnych do badań przygotowujących do RCT, omówienie roli randomizacji na etapie badań eksploracyjnych zostało wyraźnie przedstawione w przewodnikach., Randomizacja w ramach badania rozpoznawczego została uznana za konieczną do zbadania wykonalności rekrutacji, zgody na randomizację, zatrzymania, skażenia lub utrzymania ślepoty w grupach kontrolnych i interwencyjnych, procedur randomizacji oraz tego, czy wszystkie elementy protokołu mogą ze sobą współpracować, chociaż randomizacja nie została uznana za konieczną do oceny obciążenia wynikowego i kwalifikowalności uczestników ., Chociaż istniał konsensus co do tego, jakie kwestie można ocenić poprzez randomizację, źródła nie zgadzały się co do tego, czy randomizacja powinna zawsze poprzedzać przyszłe badanie ewaluacyjne, nawet jeśli to przyszłe badanie ma być RCT. Kontrowersje wydawały się być związane ze zmiennością nomenklatury i związanych z nią celów. Na przykład, niektóre zdefiniowane badanie pilotażowe jako badanie prowadzone w miniaturze, aby sprawdzić, jak wszystkie jego elementy współpracują ze sobą, dyktując w ten sposób randomizowany projekt . Jednak w przypadku studiów wykonalności randomizacja była konieczna tylko wtedy, gdy zmniejszyła niepewność w szacowaniu parametrów dla przyszłej oceny ., Podobnie, inne wytyczne podkreślały, że badanie rozpoznawcze (niezależnie od nomenklatury) powinno dotyczyć głównych niepewności, a zatem nie może zależeć od randomizacji .

Szacowanie parametrów przyszłego projektu oceny

chociaż metody jakościowe uznano za przydatne do wyboru wyników i ich odpowiednich miar , większość wytycznych koncentrowała się na metodach ilościowych do szacowania przyszłych rozmiarów próbek oceny., Było to sporne ze względu na potencjał do nadmiernej lub zaniżonej wielkości próby wymagane w przyszłej ocenie ze względu na brak precyzji szacunków od małego pilota . Szacowanie rozmiarów próbek z oszacowań wielkości efektu w badaniu rozpoznawczym było jednak argumentowane przez niektórych za przydatne, jeśli istniała skąpa literatura, a badanie rozpoznawcze wykorzystywało ten sam projekt i wynik, co przyszła ocena . Klastry RCT, które są powszechne w interwencjach w dziedzinie zdrowia publicznego, zostały specjalnie oznaczone jako nieodpowiednie do szacowania parametrów do obliczeń wielkości próby (np., współczynniki korelacji wewnątrz klastrów), a także wskaźniki rekrutacji i monitorowania bez dodatkowych informacji z innych zasobów, ponieważ wymagana byłaby duża liczba klastrów i poszczególnych uczestników . Inni odnosili się do „reguł kciuka” przy określaniu wielkości próbek w badaniu rozpoznawczym z liczbą od 10 do 75 uczestników w każdym ramieniu badania w indywidualnie randomizowanych badaniach ., Niektóre z nich zaleciły również potrzebę rozważenia pożądanej znaczącej różnicy w wynikach zdrowotnych wynikających z przyszłej oceny i odpowiedniej wielkości próby potrzebnej do wykrycia tego zjawiska, zamiast przeprowadzania obliczeń wielkości próby z wykorzystaniem szacunków prawdopodobnego rozmiaru efektu na podstawie danych pilotażowych .

randomizowany projekt uznano za niepotrzebny do szacowania kosztów lub wyboru wyników, chociaż wyceniano go do szacowania wskaźników rekrutacji i retencji dla grup interwencyjnych i kontrolnych ., W przypadku gdy wytyczne wskazywały na oszacowanie wielkości efektu właściwego dla określenia wielkości próbki do przyszłej oceny, za konieczne uznano randomizowany projekt .

Theme 5: flexible vs.fixed design

W przypadku tych ostatnich projekt może ulec zmianie w trakcie badania, co jest przydatne do wprowadzania zmian do interwencji, a także przyszłego projektu oceny ., W tym przypadku dane jakościowe mogą być analizowane w miarę ich gromadzenia, kształtując proces badań rozpoznawczych, na przykład pobieranie próbek z kolejnych punktów gromadzenia danych i wyjaśniając implikacje dla skuteczności interwencji .

Może się zdarzyć, że nomenklatura używana w niektórych wytycznych (np. badania pilotażowe, które są opisane jako miniaturowe wersje oceny) sugeruje rozróżnienie między bardziej elastycznymi a bardziej rygorystycznymi projektami., W niektórych wytycznych nie wspomniano, czy zmiany należy wprowadzić w trakcie badania rozpoznawczego, czy później, w celu uzyskania najlepszego możliwego projektu przyszłej oceny .

temat 6: kryteria progresji do przyszłego badania oceniającego

przedstawiono niewiele wskazówek na temat tego, co należy wziąć pod uwagę przy formułowaniu kryteriów progresji do kontynuowania przyszłego badania oceniającego., Niektóre z nich skupiały się na istotnych wątpliwościach dotyczących wykonalności , podczas gdy inne podkreślają konkretne kwestie dotyczące opłacalności , udoskonalają hipotezy przyczynowe, które mają zostać przetestowane w przyszłej ocenie i spełniają cele rekrutacyjne . Jak omówiono w tematach 3 i 4, niektórzy ostrzegali o statystycznym sprawdzaniu skuteczności i wykorzystywaniu wielkości efektów do obliczeń mocy, a zatem kryteria oparte na rozmiarach efektów nie zostały określone .

większa dyskusja była poświęcona temu, jak ważyć dowody z badań rozpoznawczych, które dotyczyły wielu celów i wykorzystywały różne metody., Niektóre wyraźnie określone kryteria progowe nie powinny być oceniane jako rygorystyczne progi, ale jako wytyczne wykorzystujące na przykład system sygnalizacji świetlnej o różnym poziomie akceptacji . Inni podkreślili realistyczne podejście, odchodząc od wskaźników binarnych do skupiania się na „tym, co jest wykonalne i możliwe do przyjęcia dla kogo i w jakich okolicznościach”. W świetle trudności związanych z interpretacją oszacowań efektów, kilka źródeł zalecało bardziej wpływowe wyniki jakościowe badań eksploracyjnych niż wyniki ilościowe .,

Co ciekawe, pojawiły się niejasności dotyczące progresji, gdy wyniki badań wskazywały na istotne zmiany w projekcie interwencji lub oceny. Źródła rozważające tę kwestię sugerują, że jeśli „rozległe zmiany” lub „poważne modyfikacje” są wprowadzane do któregokolwiek z nich (zauważ, że nie określono, co kwalifikowane jako takie), naukowcy powinni powrócić do fazy rozwoju eksploracyjnego lub interwencyjnego .,

’alternatywnie, na etapie wykonalności, naukowcy mogą zidentyfikować podstawowe problemy z interwencji lub prowadzenia próby i powrócić do fazy rozwoju zamiast przystąpić do pełnego badania.”(str. 1).

jak już wcześniej opisano, jednak próg, przy którym zmiany są określane jako „poważne”, pozostał niejednoznaczny., Chociaż zaktualizowane wytyczne MRC zostały przeniesione na bardziej iteracyjny model, akceptując, że czasami konieczne może być przejście między wykonalnością/pilotowaniem a rozwojem interwencji, nie było wytycznych dotyczących warunków, w jakich powinien nastąpić ruch między tymi dwoma etapami.

temat 7: zaangażowanie zainteresowanych stron

kilka źródeł zalecało szereg zainteresowanych stron (np., podmioty udzielające interwencji, odbiorcy interwencji, przedstawiciele publiczni, jak również praktycy, którzy mogą skorzystać z dowodów przedstawionych podczas pełnego procesu), są zaangażowani w planowanie i prowadzenie badania rozpoznawczego, aby zapewnić, że badania rozpoznawcze odzwierciedlają realia procesu interwencyjnego . W szczególności zalecono podejście partycypacyjne oparte na społeczności ., Podczas gdy wielu podkreśliło wartość zainteresowanych stron w komitetach sterujących prób i innych podobnych grupach badawczych, niektórzy ostrzegali o równowadze między naukowcami i zainteresowanymi stronami, a także ostrzegali przed zaangażowaniem zainteresowanych stron w badania jakościowe .

” chociaż pacjenci i przedstawiciele publiczni w zespołach badawczych mogą dostarczyć pomocnych informacji zwrotnych na temat interwencji, nie stanowi to badań jakościowych i może nie doprowadzić do uzyskania wystarczająco wiarygodnych danych, aby informować o odpowiednim rozwoju interwencji.”(str. 8).,

temat 8: raportowanie badań rozpoznawczych

szczegółowe zalecenia dotyczące raportowania badań rozpoznawczych zostały niedawno przedstawione w wytycznych New Consolidated Standards of Reporting Trials (CONSORT) przez Eldridge et al. . Oprócz tego, powtarzające się punkty zostały poruszone przez inne źródła wskazówek. Przede wszystkim zaleca się publikowanie badań eksploracyjnych w recenzowanych czasopismach, ponieważ może to dostarczyć przydatnych informacji dla innych naukowców na temat tego, co zostało zrobione, co nie zadziałało i co może być najbardziej odpowiednie ., Badanie rozpoznawcze może również prowadzić do wielu publikacji, ale powinno zawierać odniesienie do innych prac przeprowadzonych w tym samym badaniu rozpoznawczym . Niektóre źródła wytycznych podkreślają również, że badania rozpoznawcze powinny być odpowiednio oznakowane w tytule/abstrakcie, aby umożliwić łatwą identyfikację; jednak sugerowana nomenklatura różni się w zależności od wytycznych .

Madame Lelica