Las Sinopsis de Evidencia: ¿está el gato muerto?

Hace poco se discutió este tema en una lista de correo del grupo de MBE y me pareció interesante.

En primer lugar, a manera de repaso, voy a describir tres definiciones importantes: POEMs, CATs y la evaluación por el sistema GRADE. Al final vemos qué piensan de la idea y de la situación actual.

POEMs

Un POEM es una «evidencia» (un artículo) importante para el paciente y el clínico, y que en teoría cambiará la práctica clínica. La palabra POEM significa «evidencia orientada al paciente que realmente es importante». Originalmente fue descrita por Slawson y Shaughnessy en 1994. En ese mismo trabajo también se introdujo el término “maestría en el manejo de la información” o Information Mastery™ y que describe los atributos clásicos de la información útil, es decir: (1) la pertinencia o relevancia en la práctica diaria, (2) la validez (debe ser correcta y con poco riesgo de sesgo), y (3) que debe requerir poco trabajo para conseguirla. Estos tres factores se relacionan en la fórmula clásica:

UTILIDAD = (relevancia x validez) / trabajo

Para incluir validez y relevancia al mismo tiempo, varias instituciones comenzaron a realizar valoraciones críticas y añadirlas a los POEMs, creando así las bases de datos de POEMs con evaluación crítica como en el caso de InfoRetriever /InfoPOEMs ahora convertido en Essential EvidencePlus. En español les llamamos AVCs o artículos valorados críticamente, que en esencia es tomar un estudio que previamente es seleccionado por su relevancia para luego pasarse por la crítica por un grupo de expertos en metodología y análisis crítico. El estudio puede ser un ensayo clínico o bien una revisión sistemática. Un gran ejemplo es la revista Evidencias en Pediatría que ya muchos conocemos y tenemos el honor de participar en la misma.

Un AVC puede ser considerado como una sinopsis de un solo estudio o bien una sinopsis de síntesis, dependiendo de si evalúa un estudio único o una revisión sistemática respectivamente. Otros ejemplos, en idioma inglés, son la revista Medicina Basada en Evidencia que hace un escrutinio en más de 100 revistas y cerca de 50.000 artículos al año para identificar aquellos más importantes y válidos, Pickets (piquetes) en la sección de educación y práctica del ADC, Archimedes en el ADC, o el ACP Journal Club entre otros. Otro gran sitio es EvidenceUpdates, que tamiza la evidencia a través de una gran cantidad de literatura de acuerdo a su relevancia e interés periodístico, todas las citas (de más de 120 revistas médicas de primera) se pre-clasifican por su validez (aunque no de forma extensa o transparente) para después ser evaluados por su relevancia clínica e interés noticioso por al menos 3 miembros de un panel mundial de médicos.

A este tipo de literatura se le denomina “pre-digerida” o “pre-evaluada”. Para su mejor comprensión y organización Bryan Haynes, de la Universidad de McMaster, creó el modelo de las “4s”, después modificado a “5s”, y finalmente a la pirámide o modelo de las “6s” para incluir una jerarquía de la evidencia (esto es, más arriba en las capas de la pirámide estará la sinopsis de las revisiones sistemáticas sobre la sinopsis de los estudios individuales).

CATs (critically appraised topics)

En español podrían llamarse tópicos evaluados críticamente (en nuestro México, los llamamos TACOs, por Tópicos Abordados mediante la Crítica y Objetividad)

Definido como un breve resumen de la evidencia sobre un tema de interés siempre en relación con una pregunta clínica enfocada, es decir, muy específica. Se trata de un breve escrito considerado una versión más corta y menos rigurosa de una revisión sistemática, que trata de sintetizar la mejor evidencia disponible sobre un tema, por lo general (e idealmente) mediante la evaluación de más de un estudio.

Los CATs también aumentaron su número a finales de los 90 y tuvo un auge en la primera década de la década del 2000. Pronto emergieron softwares (como los CATmakers) y bases de datos en diferentes sitios web. Buenos ejemplos de los CAT son los de la Universidad de Michigan, La Universidad de Duke, Bandolera, entre muchos otros, en diferentes formatos, tales como los BestBETs. Todos ellos tratan de responder a una pregunta clínica mediante el uso de un enfoque menos riguroso que una revisión sistemática formal.

GRADE

El Grupo de trabajo de GRADE (Grading of Recommendations Assessment, Development and Evaluation) ha desarrollado un método transparente para la clasificación de la evidencia por su calidad y la fuerza de las recomendaciones clínicas.

GRADE especifica y justifica la elección de los resultados (outcomes) de interés y clasifica su importancia, evalúa la evidencia, e incorpora las pruebas con las consideraciones de los valores y preferencias de los pacientes, la sociedad y el clínico para llegar a las recomendaciones finales.

GRADE inicialmente estaba destinado a ser utilizado para las recomendaciones de guías de práctica clínica, sin embargo ahora también se utiliza para crear tablas resumen de resultados “tablas SOF”, por “Summary of Findings”, que se incluyen en algunas revisiones sistemáticas Cochrane y evaluaciones de tecnología sanitaria (HTAs).

El lado atractivo de las tablas SoF de GRADE son su transparencia a través de los perfiles de evidencia (EP) y hacen una completa evaluación de un conjunto de pruebas para responder a una pregunta clínica específica. Para fines prácticos, es un CAT mucho más condensado y transparente al momento de evaluar la evidencia. Ofrece un proceso estructurado para desarrollar y presentar los resúmenes de evidencia.

Las críticas hacia los CATs son principalmente de validez. Es decir, son sujetas a la crítica en muchos puntos; por ejemplo, de sesgo de publicación, mala combinación de datos, evidencia indirecta, etc. Si de hecho estas críticas son muchas veces aplicadas a una revisión sistemática hecha con metodología estricta como las de Cochrane, será mucho más común encontrarlas en un CAT cuya metodología es más “relajada”.

Mi pregunta es ¿Por qué no hacer los nuevos CATs (si es que se seguirán haciendo) con una metodología más transparente como la utilizado por el sistema GRADE?

Algunas similitudes entre los CATs y los perfiles de GRADE.

● Ambos tienen la intención de responder a preguntas clínicas específicas (sobre todo acerca de las intervenciones diagnósticas y terapéuticas)

● Ambas tienen que realizar (idealmente) una exhaustiva búsqueda bibliográfica en varias bases de datos. Lamentablemente, esto no es una tarea fácil y tal vez el riesgo de sesgo de publicación no siempre será posible determinar. En este campo, una de las ventajas del enfoque de GRADE es que, cuando sea posible, la pregunta clínica se contesta sobre la base de una revisión sistemática reciente. También es ventaja que la revisión sistemática se utiliza como una herramienta para aprovechar el trabajo ya realizado por los revisores sistemáticos, es decir, la búsqueda de los estudios individuales y la combinación de los datos cuando posible. Es decir, en un CAT a veces incluimos una revisión sistemática como evidencia; en un perfil GRADE no, sino que se estaría utilizando los estudios individuales incluidos en esa revisión y no la revisión en sí.

● Los dos son cortas y concisas. Sin embargo, el perfil GRADE proporciona evidencia «condensada», en donde se puede apreciar como la calidad general de la evidencia se “degrada” o “incrementa” en función de su riesgo de sesgo, la evidencia directa, sesgo de publicación, y la similitud entre los estudios. Además, estos datos se presentan en los diferentes resultados con un grado diferente para cada resultado.

Algunas de las dificultades que se me ocurre es que los perfiles GRADE son mucho más laboriosos para crear. Aunque puedes utilizar su software gratis para su descarga, la tarea es difícil, especialmente si no existen revisiones sistemáticas sobre los que puede basar su perfil o si el autor no tiene experiencia en cuestiones metodológicas.

No sé si sea justa la pregunta pero ¿Qué usa con mayor frecuencia un profesional de salud? ¿Qué es mejor para su práctica diaria? Un solo artículo evaluado por su relevancia y validez o un resumen de la evidencia sobre la base de una pregunta clínica específica. Es decir: ¿AVC o un CAT? En una rápida ojeada a la internet me encontré con muchos AVCs, y pocos CATs (recientes)

En conclusión,el CAT (gato) no está muerto, pero sí moribundo. Cualquiera que desee revivir a los CATs debería adoptar y tomar ventaja del enfoque de GRADE. Sería genial tener bancos de CATs con tablas SoF y perfiles de evidencia transparentes y listos para compartir, obviamente estando abiertos a las críticas por cualquier académico, clínico, desarrollador de guías clínicas, revisiones sistemáticas, o ¿por qué no? incluso los pacientes en su contexto apropiado y lenguaje claro.

Los AVC y los CATs no se contraponen y creo que ambos son esenciales para proveer de información veraz y relevante. Los CATs han sido un tanto desdeñados en los últimos años con justas razones. No creo tampoco que desaparezcan, pero pienso que podrían darle una ayudadita.

Tal vez esto es una utopía, y estoy siendo un tanto ingenuo, pero creo que vale la pena probar algún día.

Carlos A. Cuello

Centro de Medicina Basada en Evidencia

Tecnológico de Monterrey

Comparte esta entrada: Share this post with the world.