Ocena metod obliczeniowych do metaanaliz zbiorczych danych do badań dokładności testów diagnostycznych Metodologia badań medycznych BMC

Ocena metod obliczeniowych do metaanaliz zbiorczych danych do badań dokładności testów diagnostycznych  Metodologia badań medycznych BMC

W tej sekcji opisujemy powszechnie stosowany tradycyjny model metaanalizy ADMA dla DTA, trzy metody obliczeniowe zastosowane do oszacowania parametrów tego modelu oraz metody naszego badania symulacyjnego.

Forma standardowa

Dwuwymiarowy model dwumianu normalnego (BBN) to dwuwymiarowy model efektów losowych opracowany po raz pierwszy przez Zhou i Cole’a [4]. Model BBN zakłada rozkład dwumianowy do modelowania zmienności wewnątrz badania oraz dwuwymiarowy rozkład normalny do modelowania zmienności Se i Sp pomiędzy badaniami pomiędzy badaniami. BBN jest ogólnie akceptowany jako preferowany model DTA ADMA, ponieważ modeluje zmienność w obrębie badania przy użyciu dokładnego rozkładu dwumianowego zamiast przybliżania go do rozkładu normalnego i nie wymaga niestandardowej korekcji ciągłości, gdy którakolwiek z czterech częstotliwości komórek w DTA zawierają zliczenia zerowe. Jeśli pozwolimy \(\textbf{y}_i = [\text {logit}(Se_i), \text {logit}(Sp_i)]’\) Wskazuje czułość i swoistość zarejestrowaną w zapisie badania, \(\textbf{b}_i\) specyficzne dla badania efekty losowe, \(\farvik {\mu}\) Połączony wektor czułości i swoistości oraz \(\varvec{\sigma }\) Parametryzując heterogeniczność między badaniami, marginalną funkcję wiarygodności modelu BBN można podać jak w równaniu 1. Ponieważ jednak prawdopodobieństwo to nie ma wyrażenia zamkniętego, ponieważ całki nie można ocenić analitycznie w postaci zamkniętej [4]do oszacowania prawdopodobieństwa należy zastosować metody aproksymacji numerycznej.

$$\begin{aligned} TP_i|b_{1i}&\sim \text {Dwumianowy}(n_{1i}, Se_i); y_{1i} = \mu _1 + b_{1i}; \TN_i|b_{2i}&\sim \text {dwumianowy}(n_{2i}, Sp_i); y_{2i} = \mu _2 + b_{2i}; \\ \textbf{b}_i&\sim N_2(\textbf{0}, \varvec{\Sigma }); \end{align}$$

$$\begin{aligned} L(\varvec{\mu}, \varvec{\Sigma }|\textbf{y}) = \int _{\mathbb {R}^2}\prod _{i=1} ^{k}f_{\mathbf {y_i}| \textbf{b}_i}(\textbf{y}_i|\textbf{b}_i,\varvec{\mu })f_{\textbf{b}_i}(\textbf{b}_i|\mathbf {\ sigma }_i)d\textbf{b}_i, \end{align}$$

(1)

Gdzie \(t=1,…,k\) Wskazuje I-Badanie w metaanalizie.

AGHQ [6] Jest to metoda numeryczna stosowana do przybliżania logarytmów szans poprzez całkowanie numeryczne w celu uzyskania MLE parametrów modelu. Chociaż estymacja staje się dokładniejsza wraz ze wzrostem liczby kwadratów punktów, często prowadzi do trudności obliczeniowych związanych z wielowymiarowymi efektami losowymi i problemami ze zbieżnością, gdy wariancje są bliskie zeru lub rozmiary grup są małe [6]. Najczęściej AGHQ [6] Jest to domyślna metoda szacowania i uznawana jest za najdokładniejszą. Jednak Los Angeles [6] Jest to kwadrat Gaussa-Hermite’a pierwszego rzędu [17] I IRLS [7, 8] Które ma na celu iteracyjne znalezienie rozwiązania ważonej metody najmniejszych kwadratów, może być również użyte do znalezienia MLE i zwykle wiąże się z mniejszymi trudnościami obliczeniowymi i większą szybkością obliczeń.

READ  Genesis przedstawia nowe G80 Sport

Projekt badania symulacyjnego

Symulacja danych

Aby porównać trzy metody obliczeniowe dla każdego zestawu ustawień parametrów modelu, przeprowadziliśmy symulację danych w oparciu o każdy scenariusz symulacji i dopasowaliśmy model BBN przy użyciu algorytmów AGHQ, LA i IRLS. Aby wzbogacić nasze symulacje, wyodrębniliśmy bazę danych przeglądów systematycznych Cochrane i wybraliśmy 64 przeglądy zawierające dane z metaanaliz. Wykrycie tych przeglądów i przeprowadzenie czyszczenia danych dało nam dostęp do 393 metaanaliz obejmujących szeroki zakres medycznych testów diagnostycznych. Do każdej z 393 metaanaliz dopasowaliśmy model BBN, aby uzyskać empiryczny rozkład parametrów modelu. Na podstawie tych wyników definiujemy nasze prawdziwe ustawienia parametrów, jak pokazano w Tabeli 1. Za Ju i in. (2020) [9] oraz Jackson i in. (2018) [18]wprowadziliśmy wariancję do metaanalizy, biorąc pod uwagę istotne wartości (se, Sp).

Tabela 1: Rzeczywiste ustawienia parametrów do badań symulacyjnych

W związku z tym uznaliśmy za sumę \(3^4\razy 4 = 324\) Ogólne scenariusze w naszym badaniu symulacyjnym. Dla każdego zestawu parametrów przeprowadziliśmy badanie symulacyjne poprzez (1) symulację 1000 danych DTA w oparciu o zwykłe efekty losowe, postępując zgodnie z krokami opisanymi przez Negeri i Beyene [19](2) dopasować model BBN do każdej symulowanej danych trzema metodami obliczeniowymi oraz (3) porównać wyniki oszacowane każdą metodą numeryczną z wartościami rzeczywistymi w zakresie błędu bezwzględnego, RMSE, szerokości CI, prawdopodobieństwa pokrycia, współczynnik zbieżności i czas obliczeń.

Użyliśmy tego R Język statystyczny [20] Wersja 4.2.2 i RStudio [21] Wersja 2023.09.0+463 dla wszystkich analiz danych. Użyliśmy tego błysk() Funkcja lme4 R eksmisja [22] Aby zastosować IRLS i LA, ustawiając nAGQ odpowiednio na 0 i 1. Dopasowaliśmy model BBN do algorytmu AGHQ za pomocą mix_model() Funkcja GLMAdaptive R eksmisja [23] Ustawiając liczbę punktów kwadratowych używanych w przybliżeniu (nAGQ) na 5.

Kryteria oceny wyników

W naszym badaniu symulacyjnym definiujemy współczynnik zbieżności modelu BBN jako liczbę napadów, które zbiegły się w stosunku do całkowitej liczby napadów w iteracji. Dopasowania z niedodatnimi półokreślonymi macierzami kowariancji oraz dopasowania, które nie spełniały warunków optymalności, uznaliśmy za niezbieżne. Oceniając współczynnik konwergencji, odkryliśmy, że komunikat „zbieżny” w podsumowaniu modelu pochodzi z: Glmir() Funkcja ta jest czasami zawodna. Na przykład podczas dopasowywania modelu BBN pojawił się komunikat ostrzegawczy w rodzaju „Dopasowanie granic (liczba pojedyncza): Zobacz pomoc („isSingular”)”, wskazujący dopasowanie, które nie było zbieżne, ale opcja „zbieżny” błędnie przedstawiła zbieżność. Dlatego w celu obliczenia współczynnika zbieżności potraktowaliśmy te pojedyncze dopasowania jako brak zbieżności. Zmierzyliśmy prędkość obliczeniową każdej metody numerycznej za pomocą RWbudowana funkcja czas systemu(). Pozostałe wskaźniki, takie jak odchylenie bezwzględne, RMSE, prawdopodobieństwo pokrycia i szerokość CI, obliczono według Burtona i in. (2006) [24] oraz Morris i in. (2019) [25].

READ  Jak usunąć i zresetować zablokowany iPhone lub iPad

Randolph Howe

„Zła entuzjasta podróży. Irytująco skromny ćpun internetu. Nieprzepraszający alkoholiczek”.

Rekomendowane artykuły

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *