Method Article
Quando gli studi controllati randomizzati non sono fattibili, una fonte completa di dati sanitari come il Military Health System Data Repository fornisce un'alternativa interessante per le analisi retrospettive. L'incorporazione dei dati sulla mortalità derivanti dall'indice nazionale di mortalità e il bilanciamento delle differenze tra i gruppi che utilizzano la ponderazione della propensione aiuta a ridurre i pregiudizi inerenti ai progetti retrospettivi.
Quando gli studi controllati randomizzati non sono fattibili, gli studi retrospettivi che utilizzano i big data forniscono un'alternativa efficiente ed economica, anche se sono a rischio di distorsione della selezione del trattamento. La distorsione della selezione del trattamento si verifica in uno studio non randomizzato quando la selezione del trattamento si basa su caratteristiche pre-trattamento che sono associate anche al risultato. Queste caratteristiche di pre-trattamento, o confondenti, possono influenzare la valutazione dell'effetto di un trattamento sul risultato. I punteggi di propensione riducono al minimo questa distorsione bilanciando i confondenti noti tra i gruppi di trattamento. Esistono alcuni approcci per eseguire analisi del punteggio di propensione, tra cui la stratificazione in base al punteggio di propensione, alla corrispondenza della propensione e alla probabilità inversa di ponderazione del trattamento (IPTW). Descritto qui è l'uso di IPTW per bilanciare le comorbilità di base in una coorte di pazienti all'interno del repository di dati del sistema sanitario militare degli Stati Uniti (MDR). L'MDR è una fonte di dati relativamente ottimale, in quanto fornisce una coorte contenuta in cui sono disponibili informazioni quasi complete sui servizi ospedalieri e ambulatoriali per i beneficiari idonei. Di seguito è descritto l'uso della MDR integrato con le informazioni dell'indice nazionale di mortalità per fornire dati solidi sulla mortalità. Sono inoltre forniti suggerimenti per l'utilizzo di dati amministrativi. Infine, il protocollo condivide un codice SAS per l'utilizzo di IPTW per bilanciare i confondenti noti e tracciare la funzione di incidenza cumulativa per il risultato dell'interesse.
Randomizzati, studi controllati con placebo sono il più forte disegno di studio per quantificare l'efficacia del trattamento, ma non sono sempre fattibili a causa di requisiti di costi e tempi o una mancanza di equipoise tra i gruppi di trattamento1. In questi casi, un progetto di coorte retrospettivo che utilizza dati amministrativi su larga scala ("big data") spesso fornisce un'alternativa efficiente ed economica, anche se la mancanza di randomizzazione introduce la distorsione della selezione del trattamento2. La distorsione della selezione del trattamento si verifica negli studi non randomizzati quando la decisione di trattamento dipende dalle caratteristiche pre-trattamento associate all'esito di interesse. Queste caratteristiche sono note come fattori di confusione.
Poiché i punteggi di propensione riducono al minimo questa distorsione bilanciando i confondenti noti tra i gruppi di trattamento, sono diventati sempre più popolari3. I punteggi di propensione sono stati utilizzati per confrontare gli approcci chirurgici4 e regimi medici5. Recentemente, abbiamo utilizzato un'analisi della propensione dei dati dal Repository dati del sistema sanitario militare degli Stati Uniti (MDR) per valutare l'effetto delle statine nella prevenzione primaria degli esiti cardiovascolari in base alla presenza e alla gravità del calcio coronario6.
L'MDR, utilizzato meno frequentemente dei set di dati Medicare e VA a scopo di ricerca, contiene informazioni complete sulle indicazioni amministrative e mediche dei servizi ospedalieri e ambulatoriali forniti per i beneficiari sanitari del Dipartimento della Difesa (DoD) in servizio attivo e i loro familiari a carico. Il database include servizi forniti in tutto il mondo presso strutture militari statunitensi o presso strutture civili fatturate al DoD. Il database include i dati completi della farmacia dal 1 ottobre 2001. I dati di laboratorio sono disponibili a partire dal 2009, ma sono limitati solo alle strutture di trattamento militare. All'interno della MDR, le coorti sono state definite con metodi come l'uso di codici diagnostici (ad esempio, diabete mellito7) o codici di procedura (ad esempio, chirurgia artroscopica8). In alternativa, una coorte definita esternamente di beneficiari idonei, ad esempio un registro, può essere abbinata all'MDR per ottenere dati di base e di follow-up9. A differenza di Medicare, l'MDR include pazienti di tutte le età. È anche meno di parte nei confronti dei maschi rispetto al database VA poiché include i dipendenti. L'accesso all'MDR è tuttavia limitato. In generale, solo gli investigatori che sono membri del sistema sanitario militare possono richiedere l'accesso, analogamente ai requisiti per l'uso del database VA. I ricercatori non governativi che chiedono l'accesso ai dati dei sistemi sanitari militari devono farlo attraverso un accordo di condivisione dei dati sotto la supervisione di uno sponsor governativo.
Quando si utilizza un set di dati amministrativi, è importante tenere a mente le limitazioni e i punti di forza della codifica amministrativa. La sensibilità e la specificità del codice possono variare in base alla diagnosi correlata, sia che si tratti di una diagnosi primaria o secondaria, o se si tratta di un file ospedaliero o ambulatoriale. I codici ospedalieri per l'infarto miocardico acuto sono generalmente riportati con precisione con valori predittivi positivi superiori al 90%10, ma l'uso del tabacco è spesso sottocodificato11. Tale sottocodifica può o non può avere un effetto significativo sui risultati di uno studio12. Inoltre, possono esistere diversi codici per una determinata condizione con diversi livelli di correlazione alla malattia nella domanda13. Un team investigativo deve eseguire una ricerca e una revisione completa della letteratura completa della classificazione internazionale della malattia, della nona revisione, della modifica clinica (ICD-9-CM) e/o dei manuali di codifica ICD-10-CM per garantire che i codici appropriati siano inclusi nello studio.
Diversi metodi possono essere impiegati per migliorare la sensibilità e l'accuratezza dei codici diagnostici per definire le condizioni comorbid. Occorre includere un periodo adeguato di "look-back" per stabilire le comorbilità di base. Il periodo di riflessione comprende i servizi ospedalieri e ambulatoriali forniti prima dell'ingresso nello studio. Un periodo di un anno può essere ottimale14. Inoltre, che richiedono due rivendicazioni separate invece di una singola affermazione può aumentare la specificità, mentre il completamento dei dati di codifica con dati farmaceutici può migliorare la sensibilità15. Selezionare i controlli grafici manuali su una parte dei dati può essere utilizzato per verificare l'accuratezza della strategia di codifica.
Una volta definite e valutate le comorbilità per la coorte in questione, può essere utilizzato un punteggio di propensione per bilanciare le differenze nelle covarie tra i gruppi di trattamento. Il punteggio di propensione deriva dalla probabilità che un paziente sia assegnato a un trattamento basato su covari noti. La contabilità di questo trattamento di propensione riduce l'effetto che i covariati hanno sull'assegnazione del trattamento e aiuta a generare una stima più fedele dell'effetto del trattamento sul risultato. Sebbene i punteggi di propensione non forniscano necessariamente risultati superiori ai modelli multivariati, consentono di valutare se i gruppi trattati e non trattati sono comparabili dopo aver applicato il punteggio di propensione3. I ricercatori di studio possono analizzare le differenze standardizzate assolute nei covariati prima e dopo la corrispondenza della propensione o della probabilità inversa di ponderazione del trattamento (IPTW) per garantire che i confondenti noti siano stati bilanciati tra i gruppi. È importante sottolineare che i confondenti sconosciuti potrebbero non essere bilanciati e si dovrebbe essere consapevoli del potenziale conforto residuo.
Se eseguiti correttamente, però, i punteggi di propensione sono un potente strumento in grado di prevedere e replicare i risultati di prove controllate randomizzate16. Delle tecniche di propensione-punteggio disponibili, corrispondenza e IPTW sono generalmente preferiti17. All'interno di IPTW, i pazienti sono ponderati in base alla loro propensione o probabilità di trattamento. I pesi stabilizzanti sono generalmente raccomandati rispetto ai pesi grezzi, mentre il taglio dei pesi può anche essere considerato18,19,20,21.
Una volta che i gruppi di studio sono equilibrati, possono essere seguiti fino all'esito di interesse. Gli studi che utilizzano dati amministrativi possono essere interessati a risultati quali tassi di riammissione e analisi del time-to-event. Negli studi interessati alla mortalità, il Military Health System Data Repository include un campo per lo status vitale che può essere ulteriormente aumentato utilizzando l'indice nazionale di mortalità (NDI)22,23. L'NDI è un database centralizzato di informazioni di record di morte dagli uffici statali gestito dal Center for Disease Control. Gli investigatori possono richiedere lo status vitale di base e/o la causa specifica del decesso in base al certificato di morte.
Il protocollo seguente descrive in dettaglio il processo di conduzione di uno studio amministrativo sul database utilizzando l'MDR aumentata con informazioni sulla mortalità da parte dell'NDI. Descrive in dettaglio l'uso di IPTW per bilanciare le differenze di base tra due gruppi di trattamento, tra cui il codice SAS e l'output di esempio.
Il seguente protocollo segue le linee guida dei nostri comitati istituzionali per l'etica umana.
1. Definizione della coorte
2. Definizione di coviti e risultati
3. Invio di una richiesta per l'MDR
4. Accesso all'MDR ed estrazione dei dati pertinenti
5. Unire i dati e costruire file sommativi
6. Corrispondenza con l'indice nazionale di mortalità (NDI)
7. De-identificazione dei dati
8. Calcolo del punteggio di propensione18,19,26
9. Creazione del modello di risultato e generazione di un grafico di funzione di incidenza cumulativa
Al termine di IPTW, tabelle o grafici delle differenze standardizzate assolute possono essere generate utilizzando rispettivamente il codice macro stddiff o il codice macro asdplot. Nella figura 1 viene illustrato un esempio di bilanciamento appropriato in una coorte di grandi dimensioni composta da 10.000 partecipanti che utilizzano la macro asdplot. Dopo l'applicazione del punteggio di propensione, le differenze standardizzate assolute sono state ridotte in modo significativo. Il cutoff utilizzato per la differenza standardizzata assoluta è in qualche modo arbitrario, anche se 0,1 viene spesso utilizzato e denota una differenza trascurabile tra i due gruppi. In una piccola coorte, un corretto bilanciamento è più difficile da raggiungere. La figura 2 mostra i risultati non riusciti del tentativo di bilanciare i covari in una coorte di 100 partecipanti.
Una volta generato il punteggio di propensione standardizzato, il team di studio può procedere con l'analisi dei risultati. L'analisi di sopravvivenza è spesso impiegata a causa della necessità di censurare i partecipanti con informazioni di follow-up irregolari, e Figura 3 raffigura un esempio dell'uso di proc phreg con pesi punteggio di propensione standardizzati per generare una funzione di incidenza cumulativa (CIF) grafico. Il grafico CIF descrive il numero crescente di eventi nel tempo. In questo caso, il gruppo non trattato, o controllo, (No Rx) ha un numero maggiore di eventi ed è relativamente peggiore del gruppo trattato (Rx).
Figura 1: Esempio di bilanciamento riuscito. In una grande coorte (n - 10.000), IPTW ha raggiunto il bilanciamento dei covariati con tutte le differenze standardizzate assolute riducendo a meno di 0,1. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 2: Esempio di bilanciamento non riuscito. In una piccola coorte (n - 100), IPTW non è stato in grado di raggiungere il bilanciamento dei covariati con molte differenze standardizzate assolute rimanendo maggiori di 0,1. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 3: Esempio di grafico della funzione di incidenza cumulativa che confronta i gruppi di trattamento. Nel corso del tempo, l'incidenza cumulativa della mortalità aumenta in entrambi i gruppi, anche se è più alta nel gruppo non trattato (No Rx). Così, in questo esempio, il gruppo trattato ha migliorato la sopravvivenza. Fare clic qui per visualizzare una versione più grande di questa figura.
Materiali supplementari. Fare clic qui per visualizzare questo file (fare clic con il pulsante destro del mouse per scaricare).
Le analisi retrospettive che utilizzano set di dati amministrativi di grandi dimensioni forniscono un'alternativa efficiente ed economica quando le sperimentazioni controllate randomizzate non sono fattibili. Il set di dati appropriato dipenderà dalla popolazione e dalle variabili di interesse, ma l'MDR è un'opzione interessante che non prevede le restrizioni di età osservate con i dati Medicare. Con qualsiasi set di dati, è importante avere una profonda familiarità con il layout e il dizionario dei dati. È necessario prestare attenzione lungo la strada per garantire che i dati completi vengano acquisiti e che i dati vengano abbinati e uniti in modo accurato.
I codici per le diagnosi devono essere definiti utilizzando la letteratura esistente e una conoscenza approfondita del sistema di codifica ICD-9-CM e ICD-10-CM per massimizzare il valore delle diagnosi assegnate. I gruppi esistenti di codici di comorbilità, tra cui l'Elixhauser27 o l'indice di comorbilità Charlson raffinato28,29, possono essere utilizzati per definire condizioni comorbide che possono influenzare l'esito dell'interesse. Analogamente, gli algoritmi di codifica convalidati nei dati amministrativi e devono essere utilizzati. La convalida dovrebbe rimanere un'area di ricerca attiva, in quanto si continua a imparare l'uso ottimale degli algoritmi di codifica ICD-9-CM e ICD-10-CM per massimizzare la classificazione accurata di un'ampia gamma di malattie.
I punteggi di propensione possono essere utilizzati per affrontare la distorsione insita in qualsiasi analisi retrospettiva. La ponderazione o la corrispondenza effettiva del punteggio di propensione dovrebbe ridurre la differenza standardizzante assoluta (ASD) al di sotto della soglia desiderata, generalmente impostata su 0,1. Un adeguato bilanciamento aiuta a garantire la comparabilità dei gruppi di trattamento per quanto riguarda i confondenti noti e sono state utilizzate tecniche di punteggio di propensietà impiegate in modo appropriato per replicare con successo i risultati casualizzati dello studio. Una volta adeguatamente bilanciati, i gruppi di trattamento possono essere confrontati con univariate time-to-event o altre analisi.
Anche con un adeguato bilanciamento, c'è il potenziale per la confondere residua3, quindi il team investigativo dovrebbe limitare l'effetto di confondenti non misurati. Inoltre, se gli effetti dei covariati sulla selezione del trattamento sono forti, la distorsione può rimanere ancora30. Nelle piccole coorti, è improbabile che i punteggi di propensione riducano completamente l'ASD al di sotto di 0,1 per tutte le variabili e l'adeguamento alla regressione può essere impiegato per contribuire a rimuovere lo squilibrio residuo31. La regolazione della regressione può essere utilizzata anche nell'analisi dei sottogruppi quando il saldo appropriato non è più garantito.
Se eseguita correttamente, la ricerca con dati amministrativi fornisce risposte tempestive a importanti domande cliniche in assenza di studi clinici randomizzati. Mentre è impossibile rimuovere tutti i pregiudizi dagli studi osservazionali, i pregiudizi possono essere limitati utilizzando i punteggi di propensione e le analisi meticolose rimanenti.
Gli autori non hanno nulla da rivelare.
La ricerca riportata in questa pubblicazione è stata supportata dal National Center for Advancing Translational Sciences dei National Institutes of Health sotto il Award Number UL1 TR002345. Il contenuto è di esclusiva responsabilità degli autori e non rappresenta necessariamente le opinioni ufficiali dei National Institutes of Health.
Disclaimer: Inoltre, le opinioni espresse in questo articolo sono quelle solo dell'autore e non devono essere interpretate per rappresentare in alcun modo quelle del governo degli Stati Uniti, del Dipartimento della Difesa degli Stati Uniti (DoD), o del Dipartimento degli Stati Uniti del Esercito. L'identificazione di prodotti specifici o strumentazione scientifica è considerata parte integrante dello sforzo scientifico e non costituisce l'approvazione o l'approvazione implicita da parte dell'autore, del Dad o di qualsiasi agenzia di componenti.
Name | Company | Catalog Number | Comments |
CD Burner (for NDI Request) | |||
Computer | |||
Putty.exe | Putty.org | ||
SAS 9.4 | SAS Institute Cary, NC | ||
WinSCP or other FTP software | https://winscp.net/eng/index.php |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon