Method Article
Wenn randomisierte kontrollierte Studien nicht möglich sind, bietet eine umfassende Datenquelle im Gesundheitswesen wie das Military Health System Data Repository eine attraktive Alternative für retrospektive Analysen. Die Einbeziehung der Sterblichkeitsdaten aus dem nationalen Sterbeindex und das Ausbalancieren von Unterschieden zwischen Gruppen, die die Neigungsgewichtung verwenden, trägt dazu bei, die Vorurteile, die retrospektiven Entwürfen innewohnen, zu verringern.
Wenn randomisierte kontrollierte Studien nicht durchführbar sind, bieten retrospektive Studien mit Big Data eine effiziente und kostengünstige Alternative, obwohl sie für die Behandlungsauswahl gefährdet sind. Die Voreingenommenheit bei der Behandlungsauswahl tritt in einer nicht randomisierten Studie auf, wenn die Behandlungsauswahl auf Vorbehandlungsmerkmalen basiert, die ebenfalls mit dem Ergebnis verbunden sind. Diese Vorbehandlungsmerkmale oder Störfaktoren können die Bewertung der Wirkung einer Behandlung auf das Ergebnis beeinflussen. Propensity-Scores minimieren diese Verzerrung, indem sie die bekannten Störfaktoren zwischen den Behandlungsgruppen ausgleichen. Es gibt einige Ansätze für die Durchführung von Neigungs-Score-Analysen, einschließlich der Schichtung nach der Neigungsnote, dem Neigungsabgleich und der umgekehrten Wahrscheinlichkeit der Behandlungsgewichtung (IPTW). Hier wird die Verwendung von IPTW beschrieben, um basisbezogene Komorbiditäten in einer Kohorte von Patienten innerhalb des US Military Health System Data Repository (MDR) auszugleichen. Der MDR ist eine relativ optimale Datenquelle, da er eine enthaltene Kohorte bietet, in der für förderfähige Begünstigte nahezu vollständige Informationen über stationäre und ambulante Leistungen zur Verfügung stehen. Im Folgenden wird die Verwendung des MDR, ergänzt durch Informationen aus dem nationalen Sterbeindex, um robuste Mortalitätsdaten liefern. Außerdem werden Vorschläge für die Verwendung von Verwaltungsdaten bereitgestellt. Schließlich teilt das Protokoll einen SAS-Code für die Verwendung von IPTW, um bekannte Störfaktoren auszugleichen und die kumulative Inzidenzfunktion für das Ergebnis von Interesse darzustellen.
Randomisierte, Placebo-kontrollierte Studien sind das stärkste Studiendesign, um die Wirksamkeit der Behandlung zu quantifizieren, aber sie sind nicht immer möglich, aufgrund von Kosten- und Zeitanforderungen oder einem Mangel an Ausrüstung zwischen den Behandlungsgruppen1. In diesen Fällen bietet ein retrospektives Kohortendesign, bei dem umfangreiche Verwaltungsdaten ("Big Data") verwendet werden, häufig eine effiziente und kostengünstige Alternative, obwohl der Mangel an Randomisierung dieVerzerrungder Behandlungsauswahl 2 einführt. Die Voreingenommenheit bei der Behandlungsauswahl tritt in nicht randomisierten Studien auf, wenn die Behandlungsentscheidung von Vorbehandlungsmerkmalen abhängt, die mit dem Ergebnis von Interesse verbunden sind. Diese Eigenschaften werden als verwirrende Faktoren bezeichnet.
Da Neigungswerte diese Verzerrung minimieren, indem sie die bekannten Störfaktoren zwischen den Behandlungsgruppen ausbalancieren, sind sie immer beliebtergeworden 3. Propensity Scores wurden verwendet, um chirurgische Ansätze4 und medizinische Therapien5zu vergleichen. Kürzlich haben wir eine Neigungsanalyse von Daten aus dem United States Military Health System Data Repository (MDR) verwendet, um die Wirkung von Statinen bei der primären Prävention kardiovaskulärer Ergebnisse basierend auf dem Vorhandensein und der Schwere des koronaren Kalziums6zu bewerten.
Der MDR, der weniger häufig als die Medicare- und VA-Datensätze für Forschungszwecke genutzt wird, enthält umfassende administrative und medizinische Schadeninformationen von stationären und ambulanten Diensten, die für aktive Militärs, Rentner und andere Begünstigte des Verteidigungsministeriums (DoD) und deren Angehörige bereitgestellt werden. Die Datenbank umfasst Dienstleistungen, die weltweit in US-Militärbehandlungseinrichtungen oder in zivilen Einrichtungen erbracht werden, die dem DoD in Rechnung gestellt werden. Die Datenbank enthält vollständige Apothekendaten seit dem 1. Oktober 2001. Labordaten liegen ab 2009 vor, sind aber nur auf militärische Behandlungseinrichtungen beschränkt. Innerhalb des MDR wurden Kohorten mit Methoden definiert, einschließlich der Verwendung von Diagnosecodes (z.B. Diabetes mellitus7) oder Verfahrenscodes (z.B. arthroskopische Chirurgie8). Alternativ kann eine extern definierte Kohorte förderfähiger Begünstigter, z. B. ein Register, mit dem MDR abgeglichen werden, um Basis- und Folgedaten zu erhalten9. Im Gegensatz zu Medicare umfasst der MDR Patienten jeden Alters. Es ist auch weniger voreingenommen gegenüber Männern als die VA-Datenbank, da es abhängige enthält. Der Zugang zum MDR ist jedoch begrenzt. Im Allgemeinen können nur Ermittler, die Mitglieder des Militärischen Gesundheitssystems sind, Den Zugriff anfordern, analog zu den Anforderungen für die Nutzung der VA-Datenbank. Nichtstaatliche Forscher, die Zugang zu den Daten von Military Health Systems suchen, müssen dies durch eine Vereinbarung über den Datenaustausch unter der Aufsicht eines staatlichen Sponsors tun.
Bei der Verwendung von administrativen Datensätzen ist es wichtig, die Einschränkungen und Stärken der administrativen Codierung zu berücksichtigen. Die Empfindlichkeit und Spezifität des Codes kann je nach der zugehörigen Diagnose variieren, ob es sich um eine primäre oder sekundäre Diagnose handelt oder ob es sich um eine stationäre oder ambulante Datei handelt. Stationäre Codes für akuten Myokardinfarkt werden in der Regel genau mit positiven Vorhersagewerten über 90%10gemeldet, aber Tabakkonsum ist oft untercodiert11. Eine solche Unterkodierung kann eine sinnvolle Wirkung auf die Ergebnisse einer Studie haben12. Darüber hinaus können mehrere Codes für eine bestimmte Bedingung mit unterschiedlichen Korrelationen mit der Krankheit in Frage13existieren. Ein Untersuchungsteam sollte eine umfassende Literaturrecherche und Überprüfung der Internationalen Klassifikation von Krankheiten, der neunten Revision, der klinischen Modifikation (ICD-9-CM) und/oder icD-10-CM-Codierungshandbücher durchführen, um sicherzustellen, dass die entsprechenden Codes in die Studie einbezogen werden.
Es können mehrere Methoden eingesetzt werden, um die Empfindlichkeit und Genauigkeit der Diagnosecodes zu verbessern, um komorbide Bedingungen zu definieren. Es sollte ein geeigneter "Look-back"-Zeitraum aufgenommen werden, um die Basiskomorbiditäten festzulegen. Die Rücklaufzeit umfasst die stationären und ambulanten Leistungen, die vor Studieneintritt erbracht werden. Ein Zeitraum von einem Jahr kann optimalsein 14. Darüber hinaus kann die Anforderung von zwei separaten Ansprüchen anstelle eines einzelnen Anspruchs die Spezifität erhöhen, während die Ergänzung von Codierungsdaten mit pharmazeutischen Daten die Empfindlichkeit verbessern kann15. Wählen Sie manuelle Diagramm-Audits für einen Teil der Daten kann verwendet werden, um die Genauigkeit der Codierungsstrategie zu überprüfen.
Sobald Komorbiditäten für die betreffende Kohorte definiert und bewertet wurden, kann ein Neigungswert verwendet werden, um Unterschiede in den Kovariaten zwischen den Behandlungsgruppen auszugleichen. Der Neigungswert ergibt sich aus der Wahrscheinlichkeit, dass ein Patient einer Behandlung auf der Grundlage bekannter Kovariaten zugeordnet wird. Die Bilanzierung dieser Neigungsbehandlung reduziert die Auswirkungen der Kovariaten auf die Behandlungszuweisung und trägt dazu bei, eine wahrere Schätzung des Behandlungseffekts auf das Ergebnis zu generieren. Während Neigungswerte nicht unbedingt überlegene Ergebnisse zu multivariaten Modellen liefern, ermöglichen sie die Beurteilung, ob die behandelten und unbehandelten Gruppen nach Anwendung des Neigungswerts3vergleichbar sind. Studienforscher können die absoluten standardisierten Unterschiede in Kovariaten vor und nach der Neigungsübereinstimmung oder der umgekehrten Wahrscheinlichkeit der Behandlungsgewichtung (IPTW) analysieren, um sicherzustellen, dass bekannte Störfaktoren zwischen Gruppen ausgeglichen wurden. Wichtig ist, dass unbekannte Störfaktoren nicht ausgeglichen werden können, und man sollte sich des Potenzials für Restverwechssungen bewusst sein.
Wenn sie richtig ausgeführt werden, sind Neigungswerte jedoch ein leistungsstarkes Werkzeug, das Ergebnisse randomisierter kontrollierter Studien vorhersagen und replizieren kann16. Von den verfügbaren Neigungs-Score-Techniken werden Matching und IPTW in der Regelbevorzugt 17. Innerhalb von IPTW werden die Patienten nach ihrer Neigung oder Wahrscheinlichkeit für eine Behandlung gewichtet. Stabilisierende Gewichte werden in der Regel über Rohgewichte empfohlen, während Das Trimmen der Gewichte kann auch als18,19,20,21betrachtet werden.
Sobald die Studiengruppen ausgewogen sind, können sie bis zum Ergebnis des Interesses verfolgt werden. Studien, die administrative Daten verwenden, könnten an Ergebnissen wie Rückübernahmequoten und Zeit-zu-Ereignis-Analysen interessiert sein. In Studien, die sich für die Sterblichkeit interessieren, enthält das Military Health System Data Repository ein Gebiet für den Vitalstatus, das mit Hilfe des nationalen Todesindex (NDI)22,23weiter erweitert werden kann. Die NDI ist eine zentrale Datenbank mit Todesdaten von staatlichen Ämtern, die vom Center for Disease Control verwaltet wird. Die Ermittler können auf der Grundlage der Sterbeurkunde den grundlegenden Vitalstatus und/oder die genaue Todesursache anfordern.
Das folgende Protokoll beschreibt den Prozess der Durchführung einer administrativen Datenbankstudie unter Verwendung des MDR, der mit Mortalitätsinformationen aus dem NDI ergänzt wurde. Es wird die Verwendung von IPTW zum Ausgleich von Basisdifferenzen zwischen zwei Behandlungsgruppen, einschließlich SAS-Code und Beispielausgabe, erläutert.
Das folgende Protokoll folgt den Leitlinien unserer institutionellen Humanethikkommissionen.
1. Definition der Kohorte
2. Definition von Kovariaten und Ergebnissen
3. Antrag beim MDR
4. Zugriff auf den MDR und Extrahieren relevanter Daten
5. Zusammenführen von Daten und Erstellen von summativen Dateien
6. Übereinstimmung mit dem nationalen Sterbeindex (NDI)
7. De-Identifizierung von Daten
8. Berechnen der Neigungsnote18,19,26
9. Erstellen des Ergebnismodells und Erstellen eines Diagramms der kumulativen Inzidenzfunktion
Nach Abschluss von IPTW können Tabellen oder Plots der absoluten standardisierten Unterschiede mit dem stddiff-Makrocode bzw. dem asdplot-Makrocode generiert werden. Abbildung 1 zeigt ein Beispiel für das geeignete Ausbalancieren in einer großen Kohorte von 10.000 Teilnehmern mithilfe des asdplot-Makros. Nach Anwendung des Neigungswerts wurden die absoluten standardisierten Unterschiede deutlich reduziert. Der für die absolute standardisierte Differenz verwendete Cutoff ist etwas willkürlich, obwohl 0.1 häufig verwendet wird und einen vernachlässigbaren Unterschied zwischen den beiden Gruppen bezeichnet. In einer kleinen Kohorte ist ein richtiges Ausbalancieren schwieriger zu erreichen. Abbildung 2 zeigt die erfolglosen Ergebnisse des Versuchs, Kovariaten in einer Kohorte von 100 Teilnehmern auszugleichen.
Sobald die standardisierte Neigungsnote generiert ist, kann das Studienteam mit der Ergebnisanalyse fortfahren. Die Überlebensanalyse wird häufig verwendet, weil Teilnehmer mit ungleichmäßigen Folgeinformationen zensiert werden müssen, und Abbildung 3 zeigt ein Beispiel für die Verwendung von Proc-Phreg mit standardisierten Neigungs-Score-Gewichten, um eine kumulative Inzidenzfunktion (CIF) zu erzeugen. Das CIF-Diagramm stellt die steigende Anzahl von Ereignissen im Laufe der Zeit dar. In diesem Fall weist die unbehandelte oder Kontrollgruppe (No Rx) eine größere Anzahl von Ereignissen auf und ist vergleichsweise schlechter als die behandelte Gruppe (Rx).
Abbildung 1: Beispiel für den erfolgreichen Ausgleich. In einer großen Kohorte (n = 10.000) erreichte IPTW den Ausgleich der Kovariaten mit allen absoluten standardisierten Unterschieden, die auf weniger als 0,1 reduziert wurden. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 2: Beispiel für einen erfolglosen Ausgleich. In einer kleinen Kohorte (n = 100) war IPTW nicht in der Lage, den Ausgleich der Kovariaten zu erreichen, wobei viele absolut standardisierte Differenzen größer als 0,1 blieben. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 3: Beispiel für ein kumulatives Inzidenzfunktionsdiagramm zum Vergleich von Behandlungsgruppen. Im Laufe der Zeit nimmt die kumulative Inzidenz der Sterblichkeit in beiden Gruppen zu, obwohl sie in der unbehandelten Gruppe höher ist (No Rx). So hat die behandelte Gruppe in diesem Beispiel das Überleben verbessert. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Ergänzende Materialien. Bitte klicken Sie hier, um diese Datei anzuzeigen (Rechtsklick zum Herunterladen).
Retrospektive Analysen mit großen administrativen Datensätzen bieten eine effiziente und kostengünstige Alternative, wenn randomisierte kontrollierte Versuche nicht möglich sind. Der entsprechende Datensatz hängt von der Bevölkerung und den Variablen ab, die von Interesse sind, aber der MDR ist eine attraktive Option, die nicht die Altersbeschränkungen hat, die bei Medicare-Daten gesehen werden. Bei jedem Datensatz ist es wichtig, mit seinem Layout und Datenwörterbuch vertraut zu sein. Dabei sollte darauf geachtet werden, dass vollständige Daten erfasst und Daten genau abgeglichen und zusammengeführt werden.
Codes für Diagnosen sollten anhand vorhandener Literatur und eines gründlichen Verständnisses des ICD-9-CM- und ICD-10-CM-Codierungssystems definiert werden, um den Wert der zugewiesenen Diagnosen zu maximieren. Vorhandene Sätze von Komorbiditätscodes, einschließlich des Elixhauser27 oder des verfeinerten Charlson-Komorbiditätsindex28,29, können verwendet werden, um komorbide Bedingungen zu definieren, die das Ergebnis von Interessen beeinflussen können. Ebenso sollten validierte Codierungsalgorithmen in administrativen Daten genutzt werden. Die Validierung sollte ein Bereich der aktiven Forschung bleiben, da kontinuierlich über den optimalen Einsatz von ICD-9-CM- und ICD-10-CM-Codierungsalgorithmen gelernt wird, um die genaue Klassifizierung einer Vielzahl von Krankheiten zu maximieren.
Propensity-Scores können verwendet werden, um die Verzerrungzustände zu adressieren, die jeder retrospektiven Analyse innewohnen. Effektive Neigungsbewertung Gewichtung oder Matching sollte die absolute Standardisierungsdifferenz (ASD) unter den gewünschten Schwellenwert reduzieren, in der Regel auf 0,1 festgelegt. Ein angemessenes Gleichgewicht trägt dazu bei, die Vergleichbarkeit der Behandlungsgruppen in Bezug auf bekannte Störfaktoren zu gewährleisten, und entsprechend eingesetzte Neigungs-Score-Techniken wurden verwendet, um randomisierte Studienergebnisse erfolgreich zu replizieren. Nach dem richtigen Ausgleich können die Behandlungsgruppen mit univariater Zeit-zu-Ereignis- oder anderer Analyse verglichen werden.
Selbst bei entsprechendem Ausgleich besteht das Potenzial für Restverwechsgung3, so dass das Ermittlungsteam die Wirkung von ungemessenen Störfaktoren begrenzen sollte. Darüber hinaus, wenn die Auswirkungen der Kovariaten auf die Behandlungsauswahl stark sind, kann Die Voreingenommenheit immer noch30bleiben. In kleinen Kohorten ist es unwahrscheinlich, dass die Neigungswerte die ASD für alle Variablen vollständig unter 0,1 reduzieren, und regressionsanpassungkann verwendet werden, um das Restungleichgewicht zu beseitigen31. Regressionsanpassung kann auch in der Teilgruppenanalyse verwendet werden, wenn ein entsprechender Saldo nicht mehr gewährleistet ist.
Wenn die Forschung mit administrativen Daten korrekt durchgeführt wird, bietet sie zeitnahe Antworten auf wichtige klinische Fragen, wenn keine randomisierten klinischen Studien durchgeführt werden. Obwohl es unmöglich ist, alle Voreingenommenheit aus Beobachtungsstudien zu entfernen, kann die Verzerrung durch die Verwendung von Neigungsergebnissen und die verbleibenden akribischen Analysen begrenzt werden.
Die Autoren haben nichts zu verraten.
Die in dieser Publikation berichteten Forschungsergebnisse wurden vom National Center for Advancing Translational Sciences der National Institutes of Health unter der Award-Nummer UL1 TR002345 unterstützt. Der Inhalt liegt allein in der Verantwortung der Autoren und stellt nicht unbedingt die offizielle Meinung der National Institutes of Health dar.
Haftungsausschluss: Darüber hinaus sind die in diesem Artikel zum Ausdruck gebrachten Ansichten nur die des Autors und sollten nicht so ausgelegt werden, dass sie in irgendeiner Weise die ansichten der Regierung der Vereinigten Staaten, des US-Verteidigungsministeriums (DoD) oder des US-Außenministeriums darstellen. Armee. Die Identifizierung bestimmter Produkte oder wissenschaftlicher Instrumente wird als integraler Bestandteil des wissenschaftlichen Unterfangens betrachtet und stellt keine Billigung oder stillschweigende Billigung seitens des Autors, des DoD oder einer Komponentenagentur dar.
Name | Company | Catalog Number | Comments |
CD Burner (for NDI Request) | |||
Computer | |||
Putty.exe | Putty.org | ||
SAS 9.4 | SAS Institute Cary, NC | ||
WinSCP or other FTP software | https://winscp.net/eng/index.php |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten