Comment évaluer réellement l’impact d’une intervention en prévention, santé numérique ou IA santé ?

Sommaire

Aa
Tableau comparatif des méthodes d'évaluation en santé

Pourquoi les modèles classiques d’évaluation des dispositifs de santé deviennent insuffisants

Les dernières publications institutionnelles et scientifiques convergent désormais sur un point central : le problème n’est plus uniquement l’absence de preuves d’impacts santé, mais la manière dont l’impact est mesuré.

Le rapport 2025 de la Haute Autorité de Santé sur l’évolution des modèles d’évaluation en prévention souligne la nécessité d’intégrer des approches plus larges, tenant compte des contextes, des déterminants, des effets indirects et des conditions réelles d’implémentation.

Les systèmes de santé investissent massivement dans la prévention, la santé numérique et l’intelligence artificielle. Applications de santé, IA conversationnelles, coaching numérique, interventions comportementales, outils prédictifs et dispositifs connectés se multiplient rapidement.

Dans le même temps, les maladies non transmissibles continuent de progresser et les trajectoires de santé évoluent peu.

Ce paradoxe interroge directement la manière dont les interventions sont évaluées.

Parallèlement, plusieurs publications récentes dans le Journal of Evaluation in Clinical Practice remettent en question une vision trop restrictive de la preuve en santé, centrée exclusivement sur les essais contrôlés randomisés et les indicateurs cliniques immédiats.

Cette évolution est particulièrement importante pour :

  • les interventions comportementales,
  • la prévention,
  • les dispositifs numériques,
  • les politiques de santé publique,
  • les approches agissant sur les trajectoires de santé.

Pourquoi les essais classiques (RCT) ne suffisent plus

Le modèle dominant d’évaluation en santé repose historiquement sur les essais contrôlés randomisés (RCT).

Ces approches restent essentielles pour :

  • évaluer certaines interventions cliniques,
  • limiter les biais,
  • établir des relations causales robustes.

Mais plusieurs limites apparaissent lorsqu’il s’agit :

  • d’interventions complexes,
  • de comportements,
  • d’environnements,
  • d’organisations,
  • de santé numérique,
  • de prévention populationnelle.

Les comportements de santé dépendent :

  • des contraintes sociales,
  • des environnements,
  • des normes,
  • de l’organisation du temps,
  • de l’accessibilité des ressources.

Dans ce contexte, une intervention efficace dans un essai contrôlé peut produire des résultats beaucoup plus faibles en situation réelle.

La question centrale devient alors : comment mesurer la capacité réelle d’une intervention à transformer durablement des trajectoires de santé ?

Une confusion structurelle en santé : engagement, efficacité et impact réel

Dans la santé numérique, de nombreux indicateurs sont devenus dominants :

  • nombre de téléchargements,
  • temps passé,
  • taux d’activation,
  • engagement utilisateur,
  • satisfaction,
  • rétention,
  • fréquence d’usage.

Ces métriques sont utiles pour analyser l’adoption d’un outil.

Mais elles ne permettent pas, à elles seules, de conclure à une amélioration réelle de la santé.

Cette confusion devient centrale dans les interventions comportementales et numériques.

Un dispositif peut :

  • générer un fort engagement,
  • produire une expérience utilisateur positive,
  • améliorer certaines perceptions,
    tout en ayant :
  • peu d’effet comportemental durable,
  • peu d’impact clinique,
  • aucun effet populationnel mesurable.

Autrement dit : mesurer l’attention ne revient pas à mesurer la transformation.

Comment mesurer la capacité réelle d’une intervention à transformer durablement des trajectoires de santé ?

Ce que les nouveaux modèles d’évaluation en santé cherchent à mesurer

Les approches récentes élargissent progressivement les dimensions évaluées.

L’objectif n’est plus uniquement de savoir : “l’intervention fonctionne-t-elle ?”

Mais également :

  • pour qui ?
  • dans quelles conditions ?
  • avec quels mécanismes ?
  • avec quelle transférabilité ?
  • avec quel maintien dans le temps ?
  • avec quels effets indirects ?
  • avec quelles inégalités potentielles ?

Cette évolution rapproche :

  • les sciences comportementales,
  • la recherche interventionnelle,
  • la santé publique,
  • l’évaluation économique,
  • les sciences de l’implémentation.

Comparatif des principaux modèles d’évaluation en santé utilisés aujourd’hui

Modèle d’évaluationCe qui est principalement mesuréActeurs utilisateurs principauxPoint fortLimite principale
Essais contrôlés randomisés (RCT)Efficacité causaleRecherche clinique, médicaments, HAS, FDAForte robustesse interneFaible transférabilité réelle
Études observationnellesAssociations en vie réelleSanté publique, épidémiologieConditions réellesRisque de biais
Évaluation médico-économiqueCoût / efficacitéHAS, assureurs, OCDEAide à la décisionDifficulté à mesurer les effets longs
Évaluation comportementaleAdoption et maintien des comportementsSciences comportementales, préventionCompréhension des mécanismesMesures souvent complexes
Sciences de l’implémentationConditions de déploiement réelSanté publique, OMS, recherche interventionnelleAnalyse du passage à l’échelleMéthodes hétérogènes
Mesures numériques d’engagementUsage, activité, rétentionStart-up e-santé, plateformes numériquesSimplicité et rapiditéConfusion fréquente avec l’impact réel
Outcomes cliniques et populationnelsMorbidité, mortalité, incidenceSanté publique, systèmes de santéImpact réelTemporalité longue et coûteuse
Évaluation systémiqueInteractions entre niveauxOMS, politiques publiquesVision globaleDifficulté méthodologique élevée

© Vivoptim Solutions, 2026

Le problème majeur : la temporalité du changement

La plupart des indicateurs numériques mesurent :

  • des effets rapides,
  • visibles,
  • facilement quantifiables.

Or les transformations comportementales et populationnelles reposent sur :

  • des temporalités longues,
  • des effets indirects,
  • des dynamiques cumulatives,
  • des interactions complexes.

Par exemple :

  • un téléchargement peut être immédiat,
  • un changement durable d’activité physique nécessite parfois plusieurs années,
  • une réduction d’incidence cardiovasculaire peut prendre une décennie.

Cette asymétrie favorise mécaniquement les outils capables de produire des indicateurs rapides, même lorsque leur impact réel reste limité.

Ce que la HAS souligne désormais explicitement

Le rapport HAS 2025 insiste sur plusieurs dimensions souvent sous-évaluées :

  • transférabilité,
  • acceptabilité,
  • maintien,
  • équité,
  • externalités,
  • implémentation,
  • contexte social et environnemental.

Autrement dit : une intervention ne doit plus être évaluée uniquement sur son efficacité théorique, mais sur sa capacité réelle à produire un bénéfice durable dans des contextes réels.

Cette évolution est particulièrement importante pour :

  • la prévention,
  • les comportements santé,
  • la santé numérique,
  • l’IA,
  • les politiques populationnelles.

Exemple concret : pourquoi certaines applications santé semblent efficaces… sans modifier les trajectoires

De nombreuses applications santé montrent :

  • un engagement initial élevé,
  • des taux de satisfaction importants,
  • des améliorations à court terme.

Mais plusieurs méta-analyses récentes montrent également :

  • une forte attrition,
  • des effets modestes,
  • des difficultés de maintien,
  • peu de données sur les outcomes cliniques à long terme.

Le problème n’est donc pas uniquement : “l’application fonctionne-t-elle ?”

Mais :

  • combien de temps ?
  • chez quelles populations ?
  • dans quelles conditions ?
  • avec quel maintien ?
  • avec quels effets réels sur les trajectoires ?

Vers une nouvelle génération d’évaluation

Les modèles émergents convergent progressivement vers une logique plus intégrée.

Une intervention efficace ne peut plus être évaluée uniquement sur :

  • l’usage,
  • l’engagement,
  • la satisfaction,
  • ou même certains effets intermédiaires.

L’évaluation doit intégrer :

  • les comportements réels,
  • le maintien,
  • les déterminants,
  • les conditions d’implémentation,
  • les inégalités,
  • l’impact populationnel,
  • les effets à long terme.

Autrement dit : la question centrale devient moins : “l’intervention fonctionne-t-elle ?” que : “dans quelles conditions transforme-t-elle réellement les trajectoires de santé ?”.

Conclusion

La prévention, la santé numérique et l’IA ne souffrent plus uniquement d’un manque de preuves.

Elles souffrent aussi d’une crise des modèles d’évaluation.

Les indicateurs dominants restent souvent centrés sur :

  • l’attention,
  • l’usage,
  • l’engagement,
  • la satisfaction,
    beaucoup plus que sur :
  • la transformation durable des comportements,
  • la réduction réelle des risques,
  • l’impact populationnel.

Les publications récentes de la HAS, de l’OMS et de la littérature scientifique convergent vers une évolution importante : évaluer une intervention ne consiste plus uniquement à démontrer qu’elle fonctionne en théorie, mais à comprendre sa capacité réelle à transformer durablement des trajectoires dans des environnements complexes.


Références bibliographiques

Craig, P., et al. (2008). Developing and evaluating complex interventions: The new Medical Research Council guidance. BMJ, 337, a1655. https://doi.org/10.1136/bmj.a1655

Haute Autorité de Santé. (2025). How can we strengthen expertise to foster a paradigm shift in disease prevention? HAS.

Maddox, T. M., et al. (2024). Randomised controlled trials evaluating artificial intelligence in clinical practice: A systematic review. The Lancet Digital Health. https://doi.org/10.1016/S2589-7500(24)00047-5

Sheeran, P., & Webb, T. L. (2023). The intention–behavior gap. Annual Review of Psychology, 74, 291–318.

Skivington, K., et al. (2021). A new framework for developing and evaluating complex interventions. BMJ, 374, n2061. https://doi.org/10.1136/bmj.n2061

World Health Organization. (2021). Evidence-informed decision-making for health policy and systems.

A lire également : Santé numérique, IA, INM : où vont réellement les investissements santé en 2026 ?

Bibliographie

Aucune resource

Dans le même thème