Sensibilité et spécificité d’un test diagnostique

Sandrine Charpentier Commission Recherche SFMU 2015

Dans la démarche diagnostique, utiliser de nouveaux outils nécessite de mesurer leur performance.
Les performances d’un test se mesurent par rapport à une référence « gold standard » qui peut être un examen de référence ou une expertise permettant de catégoriser les patients en « malade » ou « non malade ».
Les résultats des tests en fonction de la classification des patients en malades et non malades peuvent être résumés dans un tableau de contingence.

Tableau de contingence

  Patients malades Patients non malades
Test positif Vrai positif (VP) Faux positif (FP)
Test négatif Faux négatif (FN) Vrai négatif (VN)


Sensibilité et spécificité expriment la capacité informative du test c'est-à-dire la capacité du test à catégoriser les patients. Elles s’expriment en termes de probabilité et par un pourcentage sur un échantillon. De ce fait, elles doivent s’accompagner d’un intervalle de confiance classiquement à 95%.
    
La sensibilité est déterminée sur une population de patients dont le statut « malade » est connu grâce au test de référence. C’est la probabilité (p) du résultat positif du test (T+) chez les sujets porteurs de la maladie (M+) telle qu’elle est définie par le gold standard appelée également taux de vrais positifs.
Se =p(T+/M+)=

    La spécificité est déterminée sur une population de patients dont le statut non malade est connu. C’est la probabilité du résultat négatif de test (T-) chez les patients définis comme non malades (M-) appelée également taux de vrais négatifs.
Spé= p(T-/M-)=

    Sensibilité et spécificité sont des propriétés du test fixées pour une maladie donnée et indépendantes de sa prévalence. Pour une pathologie donnée, on peut observer des variations de sensibilité ou spécificité en fonction du type de population dans laquelle elles sont mesurées. Plus l’échantillon contient des formes graves de la maladie, plus la sensibilité sera élevée et la spécificité basse. Ces variations ne sont pas à proprement parler des biais car elles ne sont pas secondaires à une erreur méthodologique mais à une variation des caractéristiques de la population [1].
Dans des populations à forte prévalence de la maladie, on peut constater des variations de la sensibilité ou de la spécificité d’un test. En réalité, ces modifications ne sont pas dues à la prévalence élevée mais au fait que, dans ces populations, il peut y avoir des erreurs de classification des patients ou des inclusions de patients plus sévères induisant des différences des sensibilités et spécificités d’une étude à l’autre [2].

    Dans la littérature, les auteurs tentent de définir les situations dans lesquelles la sensibilité ou la spécificité sont à privilégier :
On privilégie la sensibilité d’un test quand [3]:

  • Le but de la démarche diagnostique est d’exclure la maladie.
  • La maladie est d’autant plus curable que le traitement est plus précoce.
  • Un résultat faussement positif n’a pas de conséquence sérieuse.
  • La maladie est rare et l'on se trouve dans une situation de dépistage.

On privilégie la spécificité quand :

  • Le but de la démarche diagnostique est d’affirmer ou de confirmer le diagnostic.
  • Le risque d’un résultat faussement positif est grave et n’est pas acceptable.
  • La maladie est incurable.

    La réalité est plus complexe dans ce choix de privilégier sensibilité ou spécificité. L’augmentation de la sensibilité ne peut pas se faire sans tenir compte du « coût » de diminution simultanée de la spécificité. Le choix de privilégier l’un ou l’autre doit se faire en tenant compte des conséquences de ce choix. Ainsi, par exemple, choisir un test très sensible mais peu spécifique, donc avec un nombre de faux positifs important, n’est acceptable que si la confirmation diagnostique par un autre test peut se faire sans surcoûts ou risques démesurés pour le patient.

Références
[1] Elie C, Coste J (2008) A methodological framework to distinguish spectrum effects from spectrum biases and to assess diagnostic and screening test accuracy for patient populations: application to the Papanicolaou cervical cancer smear test. BMC Med Res Methodol 8:7.
[2] Leeflang MM, Bossuyt PM, Irwig L (2009) Diagnostic test accuracy may vary with prevalence: implications for evidence-based diagnosis. J Clin Epidemiol 62(1):5-12.
[3] Grenier B (2006). Justifier les décisions médicales et maîtriser les coûts. 6e édition ed. Paris: Masson

En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour réaliser des statistiques de visites.