ANALISI CRITICA DELLE EVIDENZE DEL TRIAL VICTOR E DELL’ANALISI AGGREGATA VICTOR/VICTORIA: UNA PROSPETTIVA STATISTICA

Ho letto con estrema attenzione l’editoriale a firma di Di Tano et al.1 inerente i risultati del trial VICTOR e la successiva analisi aggregata con lo studio VICTORIA. Pur apprezzando lo sforzo di sintesi verso una nuova frontiera terapeutica nello scompenso cardiaco a frazione di eiezione ridotta (HFrEF), ritengo necessario proporre alcune riflessioni di natura strettamente metodologica e statistica che, a mio avviso, impongono una cautela interpretativa superiore a quella suggerita dagli autori.

Il punto cardine dell’analisi risiede nel fallimento dell’end­point primario combinato nel trial VICTOR (hazard ratio 0.93; intervallo di confidenza 95% 0.83-1.04; p=0.22). In un disegno sperimentale rigoroso, la procedura di gatekeeping gerarchico prevede che la significatività statistica degli end­point secondari possa essere confermata solo in presenza di un risultato positivo sull’endpoint primario. Poiché tale condizione non è stata soddisfatta, ogni test condotto sulla mortalità cardiovascolare o sulla mortalità per tutte le cause perde la sua funzione inferenziale, ricadendo nel dominio della statistica descrittiva o della generazione di ipotesi. L’utilizzo del termine “significativa” riferito a riduzioni del rischio in endpoint secondari (seppur “nominale”) rischia di oscurare il fatto che la probabilità di errore di tipo I (falso positivo) non è più controllata per tali confronti.

Inoltre, se esaminiamo la magnitudo dell’effetto attraverso parametri di beneficio assoluto, il quadro appare meno solido di quanto suggerito dai rapporti di rischio (hazard ratio). Nel trial VICTOR, la riduzione assoluta del rischio (ARR) per l’endpoint primario è pari all’1.1% (18.0% vs 19.1%). Da un punto di vista statistico, un number needed to treat (NNT) di circa 91, associato a un intervallo di confidenza che attraversa l’unità, indica un’incertezza tale da non permettere conclusioni definitive sull’efficacia clinica in una popolazione di pazienti stabili. Anche il segnale sulla mortalità cardiovascolare (ARR 1.7%, NNT 59), sebbene numericamente interessante, deve essere pesato contro l’incidenza di eventi avversi, come l’ipotensione sintomatica (11.3% vs 9.2%), il cui incremento è statisticamente rilevante e clinicamente non trascurabile, nonché dei costi per la Sanità Pubblica. Infine appare paradossale che un farmaco riduca la mortalità (hard endpoint) ma non il combinato con le ospedalizzazioni: solitamente, come già dimostrato dagli altri farmaci per lo scompenso (inibitori del co-trasportatore sodio-glucosio di tipo 2, inibitore del recettore dell’angiotensina e della neprilisina), accade il contrario. Anche questo dato contribuisce quindi a sollevare il sospetto di un “segnale spurio” o di un problema di potenza statistica nel trial.

Un ulteriore elemento di criticità riguarda l’analisi aggregata (VICTOR + VICTORIA). Sebbene la numerosità campionaria (n = 11 155) permetta di restringere gli intervalli di confidenza e ottenere valori di p<0.01, l’eterogeneità clinica delle due popolazioni solleva dubbi sulla validità della sintesi dei dati. Il trial VICTORIA ha arruolato pazienti ad alto rischio “post-evento”, mentre il VICTOR ha selezionato pazienti ambulatoriali stabili. In presenza di una tale divergenza nel rischio basale, l’effetto osservato nell’analisi aggregata potrebbe essere dominato dalla componente ad alto rischio, “trascinando” la significatività statistica ma non risolvendo la questione dell’efficacia reale nel sottogruppo a basso rischio, dove il farmaco ha fallito il test principale.

Infine, merita un commento l’analisi per sottogruppi basata sui livelli di frammento N-terminale del propeptide natriuretico di tipo B ≤6000 pg/ml. La letteratura statistica avverte costantemente sui pericoli delle analisi di sottogruppo, specialmente quando queste vengono enfatizzate per recuperare segnali di efficacia in trial globalmente neutri. Senza una dimostrazione di interazione statistica robusta e prespecificata, la selezione di cut-off arbitrari rischia di essere un esercizio di data dredging che aumenta la probabilità di risultati spuri.

In conclusione, ritengo che dal punto di vista statistico il trial VICTOR debba essere classificato come uno studio negativo. Sebbene l’ipotesi che vericiguat possa agire sulla mortalità nel lungo periodo sia biologicamente plausibile e meritevole di ulteriori indagini, i dati attuali non forniscono, a mio giudizio, la robustezza necessaria per una traslazione immediata e generalizzata nella pratica clinica per il paziente con HFrEF stabile.

Francesco Fugetto

Scuola di Specializzazione in Malattie dell’Apparato Cardiovascolare

Università degli Studi, Verona

e-mail: francescofugetto@gmail.com

BIBLIOGRAFIA

1. Di Tano G, Di Odoardo LAF, Senni M. Il trial VICTOR e l’analisi aggregata dei trial VICTOR e VICTORIA. G Ital Cardiol 2026;27:1-4. https://doi.org/10.1714/4618.46262