Method Article
Descriviamo un metodo a più stadi per misurare l'effetto di una coorte con i dati sull'età, consentendo così di eliminare i dati in molte situazioni senza sacrificare la qualità dei dati. Il protocollo dimostra la strategia e fornisce un modello di regressione ponderata per l'analisi dei dati del carcinoma epatocellulare.
Per eliminare l'influenza dell'età e del periodo nei dati della tabella di contingenza del ciclo di età, è stato adottato un metodo a più stadi per valutare l'effetto di coorte. Il tumore maligno primario più generale del fegato è il carcinoma epatocellulare (HCC). L'HCC è associato a cirrosi epatica con eziologie alcoliche e virali. In epidemiologia, le tendenze a lungo termine della mortalità per HCC sono state delineate (o previste) utilizzando un modello di coorte per età (APC). I decessi per HCC sono stati determinati per ciascuna coorte con la sua influenza ponderata. L'intervallo di confidenza (CI) della media ponderata è piuttosto stretto (rispetto alle stime equamente ponderate). A causa dell'IC piuttosto ristretto con meno incertezza, la stima della media ponderata è stata utilizzata come mezzo per la previsione. Con il metodo multistadio, si raccomanda di utilizzare la stima della media ponderata basata su un modello di regressione per valutare l'effetto di coorte nei dati della tabella di contingenza del periodo di età.
Il tumore maligno primario più comune del fegato è il carcinoma epatocellulare (HCC). Il suo tasso di mortalità è al quinto posto negli uomini e all'ottavo nelle donne (6% degli uomini e 3% delle donne), 1 tra tutti i tumori maligni a livello mondiale. A Taiwan, è il tumore più comune negli uomini e il secondo tumore più comune nelle donne (21,8% degli uomini e 14,2% delle donne) 2. Si stima che dal 2000 il numero annuale di HCC diagnosticati in tutto il mondo sia di 564.000, di cui 398.000 uomini e 166.000 donne. In epidemiologia, il modo più comune per spiegare la relazione tra le variabili di età, periodo e coorte (APC) è che l'età e il periodo si influenzano a vicenda per creare un'esperienza generazionale unica per l'andamento della malattia studiata.
Anche se questa concettualizzazione ha ancora una precisa connessione lineare di età + coorte = periodo, l'esposizione (predittore) non è un fattore intrinseco in una coorte di nascita. Invece, proponiamo che quando i cambiamenti causano diverse distribuzioni della malattia, c'è un effetto di coorte. Tuttavia, poiché età + coorte = periodo, queste tre variabili sono linearmente correlate; solo se vengono applicate altre restrizioni è impossibile generare un modello di coorte di età stimata (APC) utilizzando gli effetti lineari di età, periodo e coorte. In questo studio, abbiamo chiarito questo problema e le potenziali restrizioni che abbiamo imposto nelle nostre precedenti pubblicazioni 4,5,6,7.
Con la minima congettura sui dati della tabella di contingenza, il metodo multistadio 8 fornisce tre fasi per valutare l'effetto di coorte. Inoltre, poiché la lucidatura mediana non dipende da una distribuzione o da un quadro specifico, è stata utilizzata per vari tipi di dati, come rapporti, rapporti logaritmici e conteggi. La lucidatura mediana è la tecnica principale utilizzata nel metodo multifase.
I dati di una tabella di contingenza a due vie 9 sono stati utilizzati per generare lo sviluppo della mediana levigata. La procedura di lucidatura della mediana viene utilizzata per eliminare gli effetti cumulativi dell'età (cioè della riga) e del periodo (cioè la colonna) sottraendo iterativamente la mediana da ogni riga e da ogni colonna. Questa procedura è spesso utilizzata nell'analisi dei dati epidemiologici 10. Un vantaggio di questa tecnica è che non sono necessarie ipotesi sulla distribuzione o la struttura dei dati nella tabella di contingenza bidirezionale. Pertanto, questa tecnica è stata ampiamente utilizzata per qualsiasi tipo di dati contenuti nella tabella, come i dati sul suicidio 11. Il modello APC è stato utilizzato anche per descrivere le tendenze a lungo termine dell'incidenza o della mortalità della malattia 5. I modelli APC spesso assumono che l'età, il periodo e la coorte abbiano effetti additivi sulla trasformazione logaritmica di malattia/mortalità. Per valutare gli effetti di coorte, il protocollo descritto genera un modello APC per l'analisi della mortalità per carcinoma epatocellulare completo (HCC) con regressione ponderata, supportando così previsioni affidabili e una valutazione moderata degli effetti del trattamento.
1. Fonti dei dati
Per dimostrare i calcoli, abbiamo utilizzato i dati annuali sulla mortalità da HCC dal 1976 al 2015 per uomini e donne a Taiwan. Per eseguire i protocolli per questo studio è stato utilizzato il pacchetto statistico per le scienze sociali (SPSS) versione 24.0 per Windows e Microsoft Excel.
2. Impostazione del modello
NOTA: Il metodo a più stadi è stato proposto da Keys e Li 8 con indagine grafica. È stata eseguita un'analisi mediana della lucidatura per eliminare gli effetti cumulativi dell'età e del periodo; Infine, questi residui della fase di lucidatura mediana nella categoria di coorte nel modello di regressione lineare sono stati regrediti e sono stati valutati gli effetti di coorte utilizzando i dati della tabella di contingenza.
I dati sulla mortalità sono stati dimostrati per 10 gruppi di età quinquennale (40-44, 45-49, 50-54, 55-59, 60-64, 65-69, 70-74, 75-79, 80-84 e 85+) e 8 periodi di cinque anni (1976-1980, 1981-1985, 1986-1990, 1991-1995, 1996-2000, 2001-2005, 2006-2010 e 2011-2015). Il numero di gruppi di coorte è stato selezionato sottraendo uno dal numero totale di gruppi di età: 10 (gruppi di età di cinque anni) + 8 (periodi di cinque anni) -1 = 17 coorti di nascita, con i gruppi di coorte di nascita indicati per anni di coorte medi come 1891, 1896, 1901, 1906, 1911, 1916, 1921, 1926, 1931, 1936, 1941, 1946, 1951, 1956, 1961, 1966 e 1971. Forniamo un formato della contingenza per fascia d'età di uomini e donne con HCC (nella Tabella supplementare 1). La Figura 1 e la Figura 2 mostrano i tassi di mortalità dell'HCC all'interno dei gruppi di età e periodo. Queste fluttuazioni erano più sostanziali tra gli uomini che tra le donne. Il rapporto basato sulla distribuzione per età mostra che all'estremità inferiore della fascia di età 40-44 anni, i tassi di mortalità per HCC sono in aumento (Figura 1). Al contrario, la Figura 2 mostra chiaramente che i tassi di mortalità per HCC sono aumentati gradualmente nella fascia di età ≥60 anni. Tuttavia, i tassi di mortalità dell'HCC basati sull'età sono cambiati sostanzialmente nel tempo, il che significa che un notevole effetto di coorte nascosto nella normale tabella delle statistiche vitali incrociate per il periodo di età non diventerà evidente fino a un certo punto in futuro.
Abbiamo implementato la procedura di lucidatura mediana sui tassi di mortalità dell'HCC log-trasformato. Gli effetti di coorte stimati per il modello APC dei tassi di mortalità dell'HCC per uomini e donne sono mostrati rispettivamente nelle Tabelle 1 e 2. Inoltre, il calcolo delle due procedure relative alla media ponderata per genere prima di ottenere le stime ponderate è riportato nelle tabelle 1 e 2. Le stime ponderate si conformano meglio ai dati rispetto agli effetti di coorte stimati in precedenza, sulla base della deviazione minima (confrontando stime equamente ponderate) dell'intervallo di confidenza (CI) delle stime ponderate.
Per gli uomini, il pannello di sinistra della Tabella 1 mostra gli effetti di coorte delle coorti di nascita. L'effetto di coorte aumenta da 0,73 (il primo effetto di coorte nel 1891) a 1,20 (il massimo effetto di coorte nel 1936). Per le donne, l'effetto di coorte aumenta da 0,68 (il primo effetto di coorte nel 1891) a 1,35 (il più grande effetto di coorte nel 1936). È importante sottolineare che rispetto alla coorte del 1891, l'effetto di coorte per uomini e donne è aumentato rispettivamente di circa il 64% e il 98%. L'aumento è stato equamente distribuito nel pannello di destra della Tabella 2. Qui, l'effetto di coorte è aumentato da 0,71 (il primo effetto di coorte nel 1891) a 1,11 (il più grande effetto di coorte nel 1936). Per le donne, un effetto simile di aumento della distribuzione è dimostrato nella colonna di destra della Tabella 2. L'effetto di coorte è aumentato da 0,64 (il primo effetto di coorte nel 1891) a 1,11 (il più grande effetto di coorte nel 1926). Pertanto, rispetto alla prima coorte di uomini e donne, abbiamo osservato un aumento dei tassi di mortalità di circa il 57% e il 73%, rispettivamente.
Tra le coorti di nascita, gli uomini nati approssimativamente nel 1936 hanno mostrato il più alto rischio di mortalità per HCC (Tabella supplementare 1). Pertanto, per le stime ponderate, l'impatto della coorte di nascita nel 1936 rispetto a quello della coorte di nascita di riferimento nel 1921 è stato di 1,11 (IC 95%: 1,08-1,14). Al contrario, la prima coorte del 1891 mostrava una tendenza in forte aumento. Inoltre, gli effetti sono stati invertiti dopo la coorte del 1936. Nella Tabella 1, rispetto alla coorte di nascita di riferimento del 1916, l'effetto ponderato era 1,11 (IC 95%: 1,07-1,16). Inoltre, con uomini e donne, abbiamo modellato gli effetti di coorte equamente ponderati e ponderati, rispettivamente, con intervalli di confidenza del 95%. Entrambe le cifre mostrano che gli effetti di coorte equamente ponderati sono più ampi di quasi tutte le larghezze degli IC al 95%.
Figura 1. Tassi di mortalità dell'HCC per 100.000 per età e periodo, uomini, Taiwan, 1976-2015. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 2. Tassi di mortalità dell'HCC per 100.000 per età e periodo, donne, Taiwan, 1976-2015. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 3. Tasso di mortalità aggiustato per età per carcinoma epatocellulare per uomini e donne a Taiwan. Clicca qui per visualizzare una versione più grande di questa figura.
Non ponderato | Ponderato | |||
Effetti | 95% CI per gli effetti | Effetti | 95% CI per gli effetti | |
Coorte | ||||
(1891~1971) | ||||
1891 | 0.73 | 0.59-0.90 | 0.71 | 0.57- 0.88 |
1896 | 0.88 | 0.79-0.99 | 0.87 | 0.78- 0.97 |
1901 | 0.89 | 0.83-0.96 | 0.81 | 0.71- 0.92 |
1906 | 0.91 | 0.86- 0.97 | 0.85 | 0.78- 0.94 |
1911 | 0.95 | 0.90-1.00 | 0.89 | 0.83- 0.96 |
1916 | 1.01 | 0.97-1.06 | 0.99 | 0.95- 1.03 |
1921 | 1 | REF | 1 | REF |
1926 | 1.04 | 1.00-1.08 | 1.03 | 1.01- 1.06 |
1931 | 1.1 | 1.06-1.14 | 1.08 | 1.06- 1.11 |
1936 | 1.2 | 1.15- 1.24 | 1.11 | 1.08- 1.14 |
1941 | 1.14 | 1.09- 1.19 | 1.1 | 1.07- 1.13 |
1946 | 1.04 | 1.00-1.09 | 1.06 | 1.04- 1.09 |
1951 | 0.91 | 0.87-0.96 | 1 | 0.98- 1.03 |
1956 | 0.87 | 0.82-0.92 | 0.96 | 0.93- 0.98 |
1961 | 0.82 | 0.76-0.88 | 0.88 | 0.85- 0.92 |
1966 | 0.76 | 0.68- 0.85 | 0.79 | 0.74- 0.83 |
1971 | 0.71 | 0.57-0.87 | 0.83 | 0.80- 0.87 |
Nota: REF = riferimento; CI = intervallo di confidenza. |
Tabella 1. Rapporti di tasso stimati e intervalli di conferenza al 95% per l'effetto della coorte di nascita sulla mortalità per carcinoma epatocellulare degli uomini a Taiwan, 1891-1971.
Non ponderato | Ponderato | |||
Effetti | 95% CI per gli effetti | Effetti | 95% CI per gli effetti | |
Coorte | ||||
(1891~1971) | ||||
1891 | 0.68 | 0.42- 1.10 | 0.64 | 0.38-1.09 |
1896 | 0.81 | 0.63-1.04 | 0.75 | 0.56- 1.00 |
1901 | 0.8 | 0.67- 0.95 | 0.7 | 0.52- 0.94 |
1906 | 0.83 | 0.72- 0.95 | 0.76 | 0.65- 0.88 |
1911 | 0.88 | 0.78- 0.99 | 0.85 | 0.78- 0.93 |
1916 | 1 | REF | 1 | REF |
1921 | 1.12 | 1.01-1.24 | 1.08 | 1.03- 1.13 |
1926 | 1.29 | 1.17-1.42 | 1.11 | 1.07- 1.12 |
1931 | 1.3 | 1.18-1.43 | 1.1 | 1.05- 1.15 |
1936 | 1.35 | 1.22-1.49 | 1.1 | 1.04- 1.14 |
1941 | 1.19 | 1.07-1.32 | 1.09 | 1.03-1.13 |
1946 | 1.05 | 0.94-1.17 | 1.06 | 1.02-1.11 |
1951 | 0.83 | 0.73-0.94 | 1 | 0.96-1.05 |
1956 | 0.67 | 0.58-0.77 | 0.93 | 0.89-0.98 |
1961 | 0.58 | 0.49-0.70 | 0.79 | 0.74-0.84 |
1966 | 0.59 | 0.46-0.75 | 0.58 | 0.49-0.69 |
1971 | 0.63 | 0.40-1.02 | 0.64 | 0.58-0.72 |
Nota: REF = riferimento; CI = intervallo di confidenza. |
Tabella 2. Rapporti di tasso stimati e intervalli di conferenza del 95% per l'effetto della coorte di nascita sulla mortalità per carcinoma epatocellulare delle donne a Taiwan, 1891-1971.
Tabella supplementare 1. Clicca qui per scaricare questa tabella.
A causa dell'andamento temporale della mortalità per HCC, i modelli convenzionali sottostimano alcune importanti caratteristiche nascoste nei dati (come gli effetti di coorte) e le analisi convenzionali che utilizzano una semplice estrapolazione lineare del tasso di correzione logaritmico dell'età osservato mostrano un'accuratezza significativamente ridotta nelle loro previsioni. È chiaro che questa tendenza è continuata per 35 anni e tenderà al rialzo nei prossimi anni se osserviamo direttamente l'andamento a lungo termine della mortalità da HCC a Taiwan dal 1976 al 2015 (Figura 3). In effetti, la recente tendenza della mortalità da HCC a Taiwan è in calo ed è guidata dall'effetto coorte (determinato dall'analisi APC), che, come accennato in precedenza, è diminuito dopo la coorte del 1936. Questo studio dimostra che l'applicazione del modello APC fornisce avvisi avanzati e più accurati sui cambiamenti di tendenza.
Da un punto di vista clinico, ci sono circa due miliardi di persone infettate dal virus dell'epatite B (HBV) 12 e circa 350 milioni di persone ne soffrono. Di conseguenza, questo è un problema di salute significativo con un'elevata morbilità in tutto il mondo. L'infezione da HBV causa un'ampia gamma di problemi clinici, tra cui lo stato di portatore inefficace per fulminare l'epatite, la cirrosi o il carcinoma epatocellulare. Il metodo di prevenzione più efficace è quello di inoculare le persone con il vaccino contro l'epatite B. Taiwan ha implementato il primo piano globale di vaccinazione di massa contro l'epatite B nel 1984 13. In questo programma, le donne in gravidanza sono state sottoposte a screening per l'antigene di superficie dell'epatite B (HBsAg) e l'antigene dell'involucro dell'epatite B (HBeAg) 14. Per i primi due anni di questo programma, il programma di immunizzazione copriva solo i bambini di madri con HBsAg. Tuttavia, a partire dal terzo anno del programma di vaccinazione, tutti i bambini sono stati coperti. Il tasso di copertura del vaccino contro l'epatite B ha raggiunto il 99% negli ultimi anni 15. Quasi il 90-95% delle persone sperimenterà l'immunità per tutta la vita dopo aver ricevuto le tre dosi del vaccino. Sottolineiamo che il declino dell'HCC pediatrico a Taiwan è in gran parte attribuito a questo programma di vaccinazione globale.
La modellazione APC illustrata in questo articolo fornisce un avviso anticipato su questi (aumentati) cambiamenti di tendenza (che diminuiranno nel prossimo futuro). Confrontando l'andamento degli effetti di coorte (Tabelle 1 e 2) e la mortalità aggiustata per età (Figura 3), il tasso di mortalità diretto aggiustato per età (o tasso di mortalità standardizzato per età) era lo stesso della media ponderata. Pondera i tassi di mortalità per età in base alla proporzione del gruppo di età di interesse basata sulla popolazione standard mondiale del 2000 16 in questo studio. Poiché la convalida degli effetti di coorte ha dominato l'ultimo modello di mortalità da HCC, abbiamo calcolato la mortalità per HCC aggiustata per età per i dati aggiornati (fino al 2011-2015). Abbiamo interpretato questo nel senso che la stima media ponderata delle coorti fornisce informazioni affidabili mentre la ricerca è preparata per prevedere la futura mortalità da HCC. I dettagli sulla previsione della mortalità da HCC sono disponibili nel nostro precedente studio 5.
Un'ipotesi generale è che ogni valore all'interno dei dati fornisca informazioni uguali per valutare i parametri in un modello. Questo approccio è stato utilizzato nella maggior parte dei metodi di modellazione (come i modelli di regressione lineare o non lineare) e significa che la deviazione standard del termine di errore è la variabile predittiva sottostante costante. Tuttavia, secondo la nostra revisione della letteratura, questa ipotesi non è adatta per la modellazione per stimare empiricamente i parametri. I parametri sconosciuti vengono stimati quando si utilizza la regressione ponderata, che genera un peso inferiore con minore precisione per i punti dati e un peso elevato con maggiore precisione per i punti dati. Il processo di ponderazione ha diminuito la deviazione standard dello stimatore. Tuttavia, le carenze del metodo di regressione ponderata sono quasi sconosciute nella pratica empirica. Poiché i pesi esatti non sono noti, i pesi stimati sono stati utilizzati per stimare i parametri. Inoltre, l'esperienza precedente ha dimostrato che la ponderazione basata sulla stima non cambia in modo significativo o di solito influisce sull'analisi di regressione o sulla sua interpretazione 17. Ipoteticamente, il modello APC può essere adattato a qualsiasi malattia in cui l'incidenza è influenzata dall'età, dal periodo e dalla coorte. Inoltre, le stime della media ponderata sono state rese disponibili per la previsione 18,19,20. Se l'IC è relativamente ristretto, l'incertezza è piccola. In considerazione del fatto che l'IC descrive l'incertezza inerente a questo tipo di valutazione e i valori al suo interno, generalmente concludiamo che l'uso dell'CI ha un impatto sostanziale.
La chemioembolizzazione arteriosa transcatetere (TACE) è uno dei metodi più efficaci per controllare clinicamente l'HCC. Tuttavia, è difficile scegliere questo metodo come terapia principale o ausiliaria, in quanto non richiede un intervento chirurgico a cielo aperto. Il fegato fornisce in genere il 75% del sangue e dei nutrienti attraverso la vena porta epatica, mentre l'arteria epatica fornisce il 25% del sangue e dei nutrienti. A differenza del sangue dell'arteria epatica estratto dalla maggior parte degli HCC, questo fluido aumenta rapidamente e raramente proviene dalla vena porta epatica. Inoltre, questo effetto è adatto alla TACE perché il cancro primario del fegato raramente metastatizza in altre parti del corpo. Anche se è improbabile che i tumori maligni epatocellulari metastatizzino, sono difficili da eradicare. Nella pratica clinica, il follow-up per i pazienti con HCC viene condotto ogni due o tre mesi. Una volta rilevato un aumento anomalo dell'alfa-fetoproteina (AFP) o un controllo ecografico anomalo, vengono eseguite la tomografia computerizzata e la risonanza magnetica. Se viene scoperto un nuovo tumore, verrà preso in considerazione il TACE. Sono stati inoltre sviluppati nuovi biomarcatori per rilevare la recidiva dell'HCC correlato all'HBV, come l'indice di tempo quantitativo del DNA dell'HBV (HDQTI) 21. Il prodotto dei risultati di follow-up e del logaritmo del rapporto di carico del DNA dell'HBV rilevato rispetto al normale è la somma degli HDQTI. L'HDQTI è utilizzato come indicatore prognostico indipendente della recidiva di HCC 21 correlata all'HBV.
Il nostro studio ha diversi limiti. In primo luogo, ci siamo limitati a ipotizzare le eziologie dei cambiamenti osservati. Utilizzando il modello APC, è stata riconsiderata la mortalità da HCC in base all'età, al periodo e agli effetti di coorte. Tuttavia, in questo studio, abbiamo utilizzato l'impostazione di lucidatura mediana come ipotesi. In secondo luogo, l'analisi APC è stata ampiamente utilizzata nel campo dell'epidemiologia nei paesi in via di sviluppo o di recente sviluppo per studi di coorte a lungo termine. In terzo luogo, non disponevamo di informazioni dal set di dati del formato accumulato per correggere i fattori confondenti nel modello APC, come le comorbidità o lo stile di vita. I dati isolati sono necessari per la ricerca futura per risolvere questa limitazione. In quarto luogo, per modificare la procedura di regressione nel metodo multistadio, abbiamo utilizzato come peso il numero di decessi dovuti all'HCC. Poiché il peso esatto non è noto, l'uso di pesi diversi provoca una leggera inflazione all'interno degli effetti di coorte stimati. In definitiva, esistono vari metodi di stima APC per risolvere il problema irriconoscibile (ad esempio, Holford utilizza tendenze lineari e di curvatura per risolvere il problema irriconoscibile 22). Allo stesso tempo, la lucidatura mediana fornisce ipotesi complesse sotto forma di conversione concettuale tra i modelli APC per valutare l'effetto di coorte con il minor numero di ipotesi e applica facilmente un formato comune per le tabelle di contingenza.
Nel complesso, l'effetto medio ponderato con un IC relativamente stretto di ciascuna coorte è stato quindi consentito dalla stima ponderata per modificare il modello di regressione. In breve, per i metodi multistadio, è consigliabile utilizzare stime ponderate di modelli di regressione per valutare gli effetti di coorte nei dati delle tabelle di contingenza per periodi di età.
Gli autori non hanno nulla da rivelare.
Questo lavoro è stato supportato dal Taipei Tzu Chi Hospital TCRD-TPE-109-RT-8 (2/3) e dal TCRD-TPE-109-39 (2/2).
Name | Company | Catalog Number | Comments |
not applicable | not applicable | not applicable | not applicable |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon