Fin dalla prima versione (1999; lavoro iniziato nel 1997) queste linee guida hanno voluto fondarsi sull'evidenza quanto meno equivoca possibile. Nelle prime due versioni (1999, 2001) si è mantenuta la classificazione della forza dell'evidenza – da cui deriva il grado della raccomandazione – basata sulla definizione del AHCPR (Agency for Health Care Policy and Research, ora AHRQ, Agency for Healthcare Research and Quality; http://www.ahcpr.gov)[2] originariamente proposta nel 1992 nella prima linea guida di pratica clinica promossa Servizio Pubblico USA e recepita poi in numerose linee guida, se pure con piccole variazioni da caso a caso.[3, 4, 5, 6, 7]
Questa classificazione si fonda però su criteri esclusivamente matematico-statistici, assegnando la "forza" dell'evidenza, nell'ordine, a: metanalisi, studi sperimentali randomizzati controllati, analisi retrospettive, follow-up prospettico, studi trasversali di popolazione, revisioni sistematiche, evidenza aneddotica. Ciò può essere corretto per quanto riguarda gli studi di natura rigorosamente clinica, soprattutto se focalizzati su valutazioni obiettive di esito, condotte in un campione della popolazione bersaglio di specifico interesse. Non è invece correttamente applicabile, se non per analogia ed estensione e con le dovute riserve, a valutazioni non di esito clinico, come informazioni epidemiologiche, valutazioni di qualità di vita, modelli econometrici e studi di ottimizzazione dell'allocazione delle risorse, o alle estrapolazioni da popolazioni non direttamente bersaglio della raccomandazione considerata, o a situazioni in cui l'oggetto della raccomandazione non può tecnicamente essere sottoposto a valutazione sperimentale adeguata. Inoltre, non esplicita una valutazione della qualità degli studi che concorrono a formare l'evidenza dalla base delle raccomandazioni.