Pierrel Research Italy/Catel Division
Via Alberto Falck, 15
20099 Sesto San Giovanni (MI)
Tel: +39 02 24134.281
Fax: +39 02 24862985
e-mail: info@spread.it
Le scelte metodologiche che hanno portato alle linee guida sono caratterizzate da:
Tali scelte metodologiche, operate in sede di definizione delle procedure operative standard per la prima stesura di SPREAD (1997; pubblicazione 1999) si sono peraltro rivelate in linea con i criteri di qualità proposti altrove, [1] e fondati proprio sulla multiprofessionalità e il coinvolgimento degli utenti, l'esplicitazione della strategia scelta per identificare l'evidenza primaria e la classificazione delle raccomandazioni in base alla qualità dell'evidenza. Una sostanziale revisione della metodologia specifica di attribuzione dei livelli di evidenza e, conseguentemente, della forza delle raccomandazioni, è stata applicata dalla revisione 2003.
Metodo
Le linee guida di pratica clinica esplicitano il percorso di ricerca di informazioni, in raccomandazioni operative accompagnate dal grado di 'forza', che a sua volta deriva dal livello di evidenza su cui si basano. Le raccomandazioni così come presentate agli utenti finali - i medici utilizzatori - devono essere convincenti, rendendo esplicito il legame tra l'evidenza riassunta e la raccomandazione proposta. Gli estensori, pertanto, devono impiegare un processo di formazione quanto più trasparente possibile, rendendo chiaro all'utente finale che la raccomandazione non nasce da una soggettiva interpretazione del materiale disponibile, ma da una accurata valutazione quanto più possibile oggettiva e condivisa con gli utilizzatori stessi. Si identificano dunque due momenti fondamentali di garanzia di trasparenza e obiettività:
La metodologia applicata per la stesura di queste linee guida discende direttamente dalla decisione sul loro formato, che a sua volta è stato determinato dalla decisione di predisporre tali linee guida per la massima diffusione a tutti i livelli.
Di conseguenza, si è scelto il formato propositivo-formativo. Per certi versi queste sono le linee guida più difficili da sviluppare, in quanto sono costituite da un'ampia e dettagliata discussione, per quanto possibile esaustiva, di ciascun aspetto del problema. A questa discussione prendono parte attiva sia soggetti responsabili della loro applicazione, sia soggetti passivi, in un vero approccio multidisciplinare. Le linee guida che ne scaturiscono propongono comportamenti e procedure basate sulla forza dell'evidenza cui si giunge sulla base del consenso, ma possono anche riportare posizioni di documentato dissenso. Possiedono quindi la forza di impatto del consenso ottenuto per confronto e possono effettivamente costituire un momento di innovazione culturale. Da queste linee guida sono state poi ottenute, per facilitarne l'applicazione pratica, linee guida in formato dogmatico. Queste sono costituite da una versione concisa, che suggerisce determinate azioni o trattamenti, anche in forma di algoritmo (flow-chart) e di "tavole delle evidenze", quindi di impiego semplificato. Tuttavia in questo caso sono sempre accompagnate, nel volume integrale, dalla relativa discussione dettagliata, in modo che rimanga comunque chiaro che le linee guida aiutano, ma non sostituiscono, il giudizio clinico caso per caso.
L'algoritmo di formazione delle linee guida è stato quello tradizionale:
Nella stesura di queste linee guida si è utilizzato il metodo di consenso formale Rand,[17] corretto per tenere conto di eventuali posizioni di dissenso ragionato, di settori in rapida evoluzione e di informazioni specifiche alla situazione italiana, come indicato in precedenza. Inoltre, mentre la procedura di consenso formale tradizionale prevede tempi lunghi, la maggior parte del lavoro di preparazione è stata in questo caso condotta per via informatica, appoggiandosi a una intranet privata virtuale.
Ciascun esperto aveva accesso in prima fase esclusivamente alla propria area di lavoro dove fare affluire i singoli contributi, accessibili al coordinatore di gruppo, a sua volta membro del core team. Quindi, eliminando per quanto possibile l'influenza di personalità dominanti e le ricadute trasversali di posizioni provenienti da aree diverse, si è costituita la prima bozza per area - che poteva coprire parte di un capitolo, un intero capitolo, o anche parti di più capitoli - con il consenso degli esperti di area. Nelle fasi di revisione biennale successive alla prima elaborazione si è tolta la limitazione di accesso alla sola propria area.
Le bozze di area sono state quindi discusse e integrate da parte del core team; da qui è nata una bozza finale, discussa nell'assemblea generale degli esperti e sottoposta all'approvazione formale di tutte le società scientifiche e gruppi coinvolti. Su tale bozza, nel corso dei Congressi "Stroke" si è ricercato il consenso da parte di esperti che non avessero avuto parte attiva nel processo di sviluppo, integrati da professionalità non mediche e da rappresentanti dei pazienti e delle loro famiglie coordinati attraverso alcune delle loro associazioni (indicati fra gli Autori come "Gruppo di revisione"). I relativi commenti sono quindi stati integrati da parte del core team nella versione qui presentata.
L'insieme delle attività espresse ha evidentemente richiesto un supporto tecnico-organizzativo e finanziario.
Il supporto tecnico è stato affidato ad una società di servizi indipendente (Catel, Milano; divisione della Hyperphar Group SpA), che ha gestito l'organizzazione degli incontri, la preparazione e manutenzione del sito informatico, e l'assemblaggio e distribuzione del materiale di volta in volta reso disponibile. Questa società non è però intervenuta in nessun modo nel processo di formazione della documentazione.
Il supporto finanziario indispensabile per le attività svolte è stato mecenaticamente offerto dalla società Bayer SpA, inizialmente nell'occasione del centenario dell'Aspirina®. Il contributo offerto non aveva quindi, e non ha, interessi di natura promozionale, e in questo significato è stato accettato. La società ha infatti messo a disposizione finanziamenti, gestiti dalla segreteria organizzativa, e supporto logistico, senza tuttavia interferire in nessun modo nel processo di formazione della documentazione.
La procedura originale
Fin dalla prima versione (1999; lavoro iniziato nel 1997) queste linee guida hanno voluto fondarsi sull'evidenza quanto meno equivoca possibile. Nelle prime due versioni (1999, 2001) si è mantenuta la classificazione della forza dell'evidenza - da cui deriva il grado della raccomandazione - basata sulla definizione del AHCPR (Agency for Health Care Policy and Research, ora AHRQ, Agency for Healthcare Research and Quality; http://www.ahcpr.gov)[2] originariamente proposta nel 1992 nella prima linea guida di pratica clinica promossa Servizio Pubblico USA e recepita poi in numerose linee guida, se pure con piccole variazioni da caso a caso.[3, 4, 5, 6, 7]
Questa classificazione si fonda però su criteri esclusivamente matematico-statistici, assegnando la "forza" dell'evidenza, nell'ordine, a: metanalisi, studi sperimentali randomizzati controllati, analisi retrospettive, follow-up prospettico, studi trasversali di popolazione, revisioni sistematiche, evidenza aneddotica. Ciò può essere corretto per quanto riguarda gli studi di natura rigorosamente clinica, soprattutto se focalizzati su valutazioni obiettive di esito, condotte in un campione della popolazione bersaglio di specifico interesse. Non è invece correttamente applicabile, se non per analogia ed estensione e con le dovute riserve, a valutazioni non di esito clinico, come informazioni epidemiologiche, valutazioni di qualità di vita, modelli econometrici e studi di ottimizzazione dell'allocazione delle risorse, o alle estrapolazioni da popolazioni non direttamente bersaglio della raccomandazione considerata, o a situazioni in cui l'oggetto della raccomandazione non può tecnicamente essere sottoposto a valutazione sperimentale adeguata. Inoltre, non esplicita una valutazione della qualità degli studi che concorrono a formare l'evidenza dalla base delle raccomandazioni.
La procedura revisionata
L'esperienza delle prime due edizioni di SPREAD seguendo la metodologia AHCPR ha evidenziato alcuni aspetti critici, peraltro già anticipati sotto il profilo teorico. Nella pratica clinica occorre ormai tener presente non solo l'efficienza in termine di risultato forte/debole di uno studio clinico randomizzato e controllato (RCT), ma anche il peso dell'evidenza, la qualità metodologica degli studi analizzati, la validità esterna, etc; tutto ciò passa necessariamente per un "giudizio ponderato" sul complesso del contenuto informativo, che diventa sempre meno soggettivo (senza mai ovviamente raggiungere la completa obiettività) quanto più si basa esplicitamente sulla valutazione dei vari criteri descritti nelle specifiche liste di verifica messe a punto da diversi organismi (SIGN, CEBM, etc).
Inoltre si è avvertita l'esigenza che già nella stesura delle linee guida - quindi non solo nel testo esplicativo che le accompagna - si tenesse conto esplicitamente della generalizzabilità, applicabilità, consistenza e impatto clinico della raccomandazione.
Ci si è anche resi conto che una certa quota di evidenza disponibile, sebbene utile ad inquadrare un problema di rilevanza clinica nel settore specifico dell'ictus, deriva da studi condotti su popolazioni che non sono immediatamente e direttamente assimilabili alle popolazioni considerate in queste linee guida: per esempio, informazioni sulla prevenzione dell'ictus derivanti da studi condotti su popolazioni con pregressa cardiopatia sono utili, ma solo in via indiretta per stimare l'effetto di determinati interventi. Queste evidenze "derivate" non potevano essere identificate come tali nella metodologia precedente, e questo problema viene risolto con la metodologia attuale.
Infine, nella realtà pratica esistono situazioni in cui non esiste "evidenza" in termini formali da cui possa derivare una raccomandazione - perché non è tecnicamente possibile sottoporle a verifica pratica, o perché, anche se teoricamente possibile, ciò non è stato (ancora) fatto - mentre esiste una esperienza concreta degli esperti che identifica una prassi raccomandabile. Queste situazioni venivano espresse con la metodologia precedente come "Grado C", senza distinguere l'opinione degli esperti basata su casi aneddotici da studi retrospettivi o non controllati. Nella nuova metodologia (Tabella 2:I) queste situazioni sono chiaramente identificate come "Good Practice Point" (GPP), risolvendo in maniera definitiva una delle ambiguità delle precedenti versioni.
La procedura di cui si è dotata la SPREAD Collaboration per rendere sempre più esplicito e trasparente il processo di formazione delle raccomandazioni si basa sulla metodologia SIGN (Scottish Intercollegiate Guideline Network, http://www.sign.ac.uk)[8] integrata, tuttavia, con l'esplicitazione di alcune considerazioni statistiche delle dimensioni dell'errore alfa e beta come indicato nella lista di verifica della metodologia CEBM (Centre for Evidence-Based Medicine, http://www.cebm.net/)[9] e può essere sintetizzata in sei passi.
Le raccomandazioni espresse in questa linea guida costituiscono dunque il momento di sintesi conclusiva dell'attività del gruppo di lavoro multidisciplinare e multiprofessionale, e la forza della raccomandazione è legata al livello dell'evidenza, secondo quanto indicato in Tabella 2:I.
Nonostante siano successivamente comparse altre tecniche per la classificazione dell'evidenza e del grado delle raccomandazioni,[10, 11, 12] il gruppo SPREAD ha deciso di attenersi alla procedura qui esposta, almeno fino alla presente edizione (V Ed., 2007).
Peraltro, il riscontro pratico alla validità di questa metodologia si è presentato concretamente nella costruzione del Consensus sullo stenting carotideo,[13] nonché nel fatto che, nelle linee guida della National Stroke Association per la gestione del TIA,[14] le linee guida SPREAD sono state ritenute tra i 13 documenti validi su 257 esaminati, e che 14 delle 53 raccomandazioni espresse derivano direttamente da SPREAD. La classificazione dell'evidenza adottata dalle linee guida citate, inoltre, è sostanzialmente la stessa adottata da SPREAD.
Una discussione più dettagliata della metodologia statistica usata, nonché un piccolo glossario dei termini statistici usati in queste linee guida, è riportato in Appendice I.
Fonti di evidenza esterna
La fonte di evidenza da cui sono state elaborate queste raccomandazioni comprende le linee guida già pubblicate in altri paesi e/o discusse nel corso di Consensus Conference recenti e sottoposte a puntuale verifica di applicabilità nel contesto concreto della realtà italiana, la documentazione specifica disponibile nel Cochrane Database of Systematic Reviews e in Clinical Evidence; documenti reperibili nella letteratura indicizzata in MEDLINE; dati da ricerche italiane e/o internazionali direttamente disponibili agli esperti che hanno partecipato alla stesura delle linee guida. Tuttavia, non sono state escluse opinioni documentate, anche se non sostenute da evidenze specificamente raccolte, su argomenti ancora in sviluppo, identificandole chiaramente come tali.
Non sono stati definiti criteri specifici di scelta a priori della letteratura da utilizzare per queste linee guida, data la diversità e disomogeneità della letteratura stessa, e il diverso peso che fonti diverse possono avere per le diverse aree considerate. Diversamente da una metanalisi, in cui i criteri di scelta diventano a loro volta criterio primario di valutazione e di validità, nel caso di linee guida i criteri di scelta della letteratura devono essere integrati da considerazioni basate sulla realtà territoriale (geografica, politica, economica, sociale e culturale) per la quale le linee guida vengono progettate.
Le ricerche bibliografiche hanno utilizzato il classico approccio per sottoinsiemi progressivamente affinati a partire dall'insieme generato dalla ricerca del termine STROKE, attraverso processi di combinazione booleani (AND-OR-NOT). Le parole chiave associate alla chiave primaria erano, naturalmente, differenti per ciascuna area e per gruppo omogeneo di domande. La profondità della ricerca ha raramente superato il quarto livello (quattro combinazioni di sottoinsiemi generati per ricerca di una singola parola chiave in tutti i campi). Per alcune aree, soprattutto quella legata allo sviluppo della ricerca, si è anche utilizzato il riferimento fornito ad articoli correlati. Non sono stati impostati filtri a priori se non quello della effettiva reperibilità della documentazione in extenso. In particolare non si è limitata la ricerca ai documenti in una specifica lingua o a una specifica area geografica o culturale. Analogamente, non si è valutata l'omogeneità delle informazioni ottenute: informazioni discordanti o addirittura contraddittorie sono state ugualmente considerate, tenendo conto naturalmente delle dimensioni della ricerca e della metodologia impiegata. Non si sono neppure imposti limiti temporali alla ricerca, anche se si sono privilegiate le informazioni più recenti. Tuttavia, informazioni precedenti ma non smentite né confermate successivamente, sono ugualmente state prese in considerazione. Responsabili ultimi della selezione della letteratura citata sono stati i coordinatori di ciascuna area, in accordo con tutti gli esperti partecipanti all'area stessa.
Nel contesto della ricerca bibliografica relativa all'epidemiologia del fenomeno e agli studi di prevenzione e di intervento, si è data priorità alla documentazione originata da ricerche multinazionali, quindi a quelle condotte in Italia se disponibili, quindi in Europa, quindi in altre aree del mondo.
Tuttavia, come indicato, non si sono escluse le conoscenze dirette degli esperti, che vengono appunto riportate come opinioni se non disponibili in letteratura. Analogamente, non si è escluso il ricorso a documentazione - soprattutto volumi - altrimenti reperibile (per conoscenza diretta degli esperti o ricerca bibliografica tradizionale) qualora pertinente all'argomento specifico e non coperta dalle pubblicazioni identificate per via elettronica.
Infine, data anche la carenza di documentazione bibliografica italiana, i suggerimenti di ordine pratico (raccomandazioni) hanno tenuto conto della realtà italiana, e di conseguenza hanno incorporato - sulla base della documentazione reperita - le opinioni ragionate degli esperti espresse dopo discussione multidisciplinare per area e sottoposte a discussione con tutti gli altri esperti delle altre aree; questo processo è stato formalizzato metodologicamente nella procedura revisionata.
Gli schemi di valutazione della letteratura secondo le procedure utilizzate da SPREAD sono riportati in Appendice D1,, disponibili nel CD-ROM e sul sito http://www.spread.it/Main/Documento.htm.
Significato della forza delle raccomandazioni
Per quanto discusso finora, è evidente che la forza di una raccomandazione non è legata al suo valore intrinseco, cioè all'utilità che può avere nell'interesse del malato, ma solo alla quantità e qualità della documentazione disponibile in forma di studi clinici. È altrettanto evidente che la quantità e qualità della documentazione, e la disponibilità di studi condotti direttamente sulla popolazione bersaglio, costituisce criterio di maggiore affidabilità, per cui raccomandazioni di grado più elevato possono implicare una maggiore affidabilità in relazione all'esito atteso.
Esistono altri metodi di esprimere la forza di una raccomandazione, apparentemente più legati all'uso pratico, come quello impiegato da Clinical Evidence(descritto esaurientemente on-line in: http://www.clinicalevidence.com/ceweb/about/guide.jsp), coerente con quanto pubblicato dal GRADE Working Group [10] e utilizzato (modificato) anche dalla ACCP Task Force [15] e dalle linee guida AHA.[16]
Nel caso delle linee guida italiane abbiamo tuttavia ritenuto più appropriato il metodo usato in SPREAD, per due motivi sostanziali.
In primo luogo, affermare che un certo intervento può essere utile o meno a prescindere dall'ambito concreto in cui si prevede la sua applicazione in una situazione di eterogeneità quale quella presente nel sistema sanitario italiano, può trasformarsi facilmente in una indicazione fuorviante, suggerendo come utili certi interventi che nel contesto specifico potrebbero invece essere meno utili a causa di situazioni o procedure locali, o implicherebbero un dispendio di risorse senza adeguato vantaggio per la popolazione, o perché, al contrario, interventi per i quali in generale rischio e beneficio si possono bilanciare, possono diventare invece altamente utili in determinate situazioni specifiche. Il secondo motivo è immediatamente consequenziale, e si lega a quanto detto nel § 2.6.
Le linee guida di pratica clinica non sono un criterio esterno indipendente che definisce l'operato del clinico a prescindere dalla situazione specifica. Al contrario, costituiscono una indicazione autorevole da recepire a livello locale e da tradurre in procedure operative standard, adeguate per le necessità, strutture e risorse localmente disponibili, con l'obiettivo di rendere il miglior servizio possibile ai malati e alla popolazione. Di conseguenza, SPREAD si limita a fornire il riferimento autorevole, indicando anche le fonti di evidenza ed i processi di formazione delle raccomandazioni, ma non intende sottrarre al singolo clinico la responsabilità di adeguare il proprio operato alla specifica situazione in cui si trova, tenendo conto di quanto presentato e discusso nelle linee guida.
Infine, nelle graduazioni del tipo di quelle citate, non si dà spazio a procedure prive di documentazione esterna, ma - come indicato in § 2.2.3 - documentazione di qualità e quantità elevata può mancare perché i relativi studi clinici non sono tecnicamente possibili, perché non sono eticamente accettabili, o anche solo perché non si è ancora riusciti a finanziarli. Addirittura, la maggior parte dei Good Practice Point non potrà mai essere documentata con adeguati studi per motivazioni etiche, mentre la necessità della loro applicazione clinica è spesso immediatamente evidente.
Di conseguenza, nella pratica applicazione delle raccomandazioni, bisognerà tenere conto non solo del grado della raccomandazione, ma anche del perché il grado è quello indicato.
IL METODO RAND
A Zaninelli e GF Gensini
SPREAD Collaborative Group, Università di Firenze
Questo metodo, messo a punto dai ricercatori della Rand Corporation (USA), rappresenta un modello, molto strutturato e articolato, di produzione del consenso. La sua principale novità, nel panorama delle formulazioni possibili di raccomandazioni di comportamento clinico, è costituita dal riconoscimento di tre punti:
Caratteristiche principali del metodo RAND:
image
Applicazione del Metodo RAND nelle Linee Guida SPREAD
Nella stesura di queste linee guida si è utilizzato il metodo di consenso formale RAND, corretto per tenere conto di eventuali posizioni di dissenso ragionato, di settori in rapida evoluzione e di informazioni specifiche alla situazione italiana. Inoltre, mentre la procedura di consenso formale tradizionale prevede tempi lunghi, la maggior parte del lavoro di preparazione è stata in questo caso condotta per via informatica, appoggiandosi a una intranet privata virtuale.
Ciascun esperto aveva accesso in prima fase esclusivamente alla propria area di lavoro dove fare affluire i singoli contributi, accessibili al coordinatore di gruppo, a sua volta membro del core team. Quindi, eliminando per quanto possibile l'influenza di personalità dominanti e le ricadute trasversali di posizioni provenienti da aree diverse, si è costituita la prima bozza per area - che poteva coprire parte di un capitolo, un intero capitolo, o anche parti di più capitoli - con il consenso degli esperti di area. Nelle fasi di revisione biennale successive alla prima elaborazione si è tolta la limitazione di accesso alla sola propria area.
| Sintesi 2-4 Per ciascuna raccomandazione espressa in queste linee guida si è cercato il consenso formale su:
|
| Sintesi 2-5 La procedura di sviluppo, elaborazione e consenso su queste linee guida si è svolta utilizzando estesamente le tecniche informatiche e ricorrendo a incontri diretti limitati al gruppo dei responsabili, a singole aree di lavoro o plenarie, nei momenti decisionali. |
| Sintesi 2-6 Queste linee guida intendono essere uno strumento di pratica applicabilità, quindi sono state considerate per ciascuna raccomandazione:
|
Le bozze di area sono state quindi discusse e integrate da parte del core team; da qui è nata una bozza finale, discussa nell'assemblea generale degli esperti e sottoposta all'approvazione formale di tutte le società scientifiche e gruppi coinvolti. Su tale bozza, nel corso dei congressi "Stroke" si è ricercato il consenso da parte di esperti che non avessero avuto parte attiva nel processo di sviluppo, integrati da professionalità non mediche e da rappresentanti dei pazienti e delle loro famiglie coordinati attraverso alcune delle loro associazioni (indicati fra gli Autori come "Gruppo di revisione").
I Bernstein SJ, Laouri M, Hilbourne LH, Leape LL, Kahan JP, Park RE, Kamberg CJ, Brook RH. Coronary angiography a literature review and ratings of appropriateness and necessity. RAND. Report JRA-03 Santa Monica, 1992.