++
Los médicos deben usar mediciones del desempeño de una prueba como la sensibilidad y especificidad para juzgar la calidad de una prueba diagnóstica para una enfermedad específica.
++
La sensibilidad de la prueba es la capacidad de una prueba para detectar una enfermedad y se expresa como el porcentaje de pacientes con la enfermedad en quienes la prueba es positiva. En consecuencia, una prueba que tiene una sensibilidad de 90% arroja resultados positivos en 90% de los pacientes enfermos y resultados negativos en 10% de los sujetos enfermos (negativos falsos). En general, una prueba con alta sensibilidad es útil para excluir un diagnóstico porque produce pocos resultados negativos falsos. Para excluir la infección por el VIH, por ejemplo, se puede elegir una prueba con sensibilidad alta como la del antígeno p24 del VIH y una prueba rápida combinada de cuarta generación con antígeno/anticuerpo del VIH-1/2 (prueba rápida combinada de HIV-1/2 Ag / Ab).
++
La especificidad de una prueba es la capacidad para detectar la ausencia de una enfermedad y se expresa como el porcentaje de pacientes sin la enfermedad en quienes la prueba es negativa. Por consiguiente, una prueba que es 90% específica genera resultados negativos en 90% de los pacientes sin una enfermedad y resultados positivos en 10% de los individuos sin la enfermedad (positivos falsos). Una prueba con alta especificidad es útil para confirmar un diagnóstico porque produce pocos resultados positivos falsos. Por ejemplo, para establecer el diagnóstico de artritis gotosa, un médico puede seleccionar una prueba muy específica como la presencia de cristales de urato birrefringentes con forma de aguja en la valoración microscópica del líquido articular. Para establecer la sensibilidad y especificidad de una prueba para una enfermedad dada, la prueba debe compararse contra una prueba “norma de referencia” independiente o con criterios diagnósticos estandarizados establecidos que definen el verdadero estado de enfermedad del paciente. Por ejemplo, la sensibilidad y especificidad de las pruebas rápidas de detección de antígeno en el diagnóstico de una faringitis por estreptococo hemolítico β del grupo A se obtienen al comparar los resultados de las pruebas rápidas de antígeno con la prueba norma de referencia, el cultivo faríngeo. La aplicación de la prueba que es norma de referencia a pacientes con pruebas rápidas de antígeno positivas establece su especificidad, mientras que la aplicación de la misma prueba a pacientes con pruebas rápidas de antígeno negativas establece la sensibilidad. La falta de aplicación de la prueba que es norma de referencia después de una prueba rápida de antígeno negativa puede ocasionar una sobreestimación de la sensibilidad dado que no se identifican los negativos falsos. Pese a ello, en muchos estados de enfermedad (p. ej., pancreatitis), una prueba que es norma de referencia independiente no existe o es muy difícil o costosa de aplicar, y en tales casos la determinación confiable de la sensibilidad y especificidad de la prueba es en ocasiones difícil de conseguir.
++
La sensibilidad y especificidad también pueden afectarse por la población a partir de la cual se derivan estos valores. Por ejemplo, muchas pruebas diagnósticas se evalúan en primer lugar a través de pacientes que tienen una enfermedad grave y grupos de control que son jóvenes y sanos. Comparado con la población general, este grupo de estudio tiene más resultados reales positivos (porque los pacientes tienen una enfermedad más avanzada) y más resultados reales negativos (porque el grupo testigo es saludable). En consecuencia, la sensibilidad y especificidad de la prueba serán más altos que los que cabría esperar en la población general, en la cual se encuentra más de un espectro de salud y enfermedad. Los médicos deben estar conscientes de este sesgo espectral cuando generalicen los resultados de las pruebas publicados con los de su propia práctica. Para reducir al mínimo el sesgo espectral, el grupo testigo debe incluir a individuos que tengan enfermedades relacionadas con el trastorno de estudio, pero que no padezcan la misma afección. Por ejemplo, para establecer la sensibilidad y especificidad de una prueba con un péptido citrulinado anticíclico para la artritis reumatoide, el grupo testigo debe incluir a pacientes con enfermedades reumáticas distintas de la artritis reumatoide. Otros sesgos, como el de la composición del espectro, conformación de la población, norma de referencia ausente o inapropiada, y sesgo de verificación, también deben considerarse en ciertas situaciones, en las que puede ser necesaria la valoración crítica de los artículos publicados.
++
Es importante tener en cuenta que la sensibilidad y especificidad notificadas de una prueba dependen del nivel del analito usado (umbral) para distinguir un resultado de la prueba normal de uno anormal. Si el umbral se reduce, la sensibilidad se incrementa a expensas de la especificidad disminuida. Si el umbral se eleva, la sensibilidad se reduce al mismo tiempo que la especificidad se incrementa (fig. e2–3).
++
++
La figura e2–4 muestra de qué manera pueden calcularse la sensibilidad y especificidad de los resultados de la prueba a partir de pacientes previamente clasificados por la norma de referencia de la prueba como enfermo o no enfermo.
++
+++
Característica operativa del receptor
++
El desempeño de dos pruebas diferentes puede compararse graficando las curvas con las características operativas receptor (ROC, receiver operator characteristc) con varios intervalos de referencia de los valores de referencia. Cada punto de la curva ROC representa un par de sensibilidad/especificidad correspondiente a un umbral de decisión particular. La curva resultante de cada prueba, obtenida mediante el trazado de la sensibilidad contra (1-especificidad) muestra con frecuencia cuál prueba es más exacta. Una prueba inobjetablemente superior tiene una curva ROC que siempre se ubica por encima y a la izquierda de la curva de la prueba inferior, y, en general, la mejor prueba posee un área más grande bajo la curva ROC. Por ejemplo, la figura e2–5 muestra las curvas ROC del PSA y de la fosfatasa ácida prostática en el diagnóstico del cáncer de próstata. El PSA es una prueba superior porque tiene un área bajo la curva significativamente mayor y una sensibilidad y especificidad más alta para todos los valores de referencia.
++
++
Observe que, para una prueba determinada, la curva ROC también permite identificar el valor de corte que reduce al mínimo los resultados positivos falsos y negativos falsos, el cual se localiza en el punto más cercano al ángulo superior izquierdo de la curva. Sin embargo, el valor de corte clínico óptimo depende de la afección que se detecte y la importancia relativa de los resultados positivos falsos contra los negativos falsos.
+
Daly
JM
et al. Which fecal immunochemical test should I choose? J Prim Care Community Health. 2017 Oct;8(4):264–77.
[PubMed: 28447866]
+
Kallner
A. Bayes' theorem, the ROC diagram and reference values: definition and use in clinical diagnosis. Biochem Med (Zagreb). 2018 Feb 15 ;28(1):010101.
[PubMed: 29209139]