Comment évaluer réellement l’impact d’une intervention en prévention, santé numérique ou IA santé ?

20/05/2026
Temps de lecture : 5 minutes

Pourquoi les modèles classiques d’évaluation des dispositifs de santé deviennent insuffisants

Les dernières publications institutionnelles et scientifiques convergent désormais sur un point central : le problème n’est plus uniquement l’absence de preuves d’impacts santé, mais la manière dont l’impact est mesuré.

Le rapport 2025 de la Haute Autorité de Santé sur l’évolution des modèles d’évaluation en prévention souligne la nécessité d’intégrer des approches plus larges, tenant compte des contextes, des déterminants, des effets indirects et des conditions réelles d’implémentation.

Les systèmes de santé investissent massivement dans la prévention, la santé numérique et l’intelligence artificielle. Applications de santé, IA conversationnelles, coaching numérique, interventions comportementales, outils prédictifs et dispositifs connectés se multiplient rapidement.

Dans le même temps, les maladies non transmissibles continuent de progresser et les trajectoires de santé évoluent peu.

Ce paradoxe interroge directement la manière dont les interventions sont évaluées.

Parallèlement, plusieurs publications récentes dans le Journal of Evaluation in Clinical Practice remettent en question une vision trop restrictive de la preuve en santé, centrée exclusivement sur les essais contrôlés randomisés et les indicateurs cliniques immédiats.

Cette évolution est particulièrement importante pour :

les interventions comportementales,
la prévention,
les dispositifs numériques,
les politiques de santé publique,
les approches agissant sur les trajectoires de santé.

Pourquoi les essais classiques (RCT) ne suffisent plus

Le modèle dominant d’évaluation en santé repose historiquement sur les essais contrôlés randomisés (RCT).

Ces approches restent essentielles pour :

évaluer certaines interventions cliniques,
limiter les biais,
établir des relations causales robustes.

Mais plusieurs limites apparaissent lorsqu’il s’agit :

d’interventions complexes,
de comportements,
d’environnements,
d’organisations,
de santé numérique,
de prévention populationnelle.

Les comportements de santé dépendent :

des contraintes sociales,
des environnements,
des normes,
de l’organisation du temps,
de l’accessibilité des ressources.

Dans ce contexte, une intervention efficace dans un essai contrôlé peut produire des résultats beaucoup plus faibles en situation réelle.

La question centrale devient alors : comment mesurer la capacité réelle d’une intervention à transformer durablement des trajectoires de santé ?

Une confusion structurelle en santé : engagement, efficacité et impact réel

Dans la santé numérique, de nombreux indicateurs sont devenus dominants :

nombre de téléchargements,
temps passé,
taux d’activation,
engagement utilisateur,
satisfaction,
rétention,
fréquence d’usage.

Ces métriques sont utiles pour analyser l’adoption d’un outil.

Mais elles ne permettent pas, à elles seules, de conclure à une amélioration réelle de la santé.

Cette confusion devient centrale dans les interventions comportementales et numériques.

Un dispositif peut :

générer un fort engagement,
produire une expérience utilisateur positive,
améliorer certaines perceptions,
tout en ayant :
peu d’effet comportemental durable,
peu d’impact clinique,
aucun effet populationnel mesurable.

Autrement dit : mesurer l’attention ne revient pas à mesurer la transformation.

Comment mesurer la capacité réelle d’une intervention à transformer durablement des trajectoires de santé ?

Ce que les nouveaux modèles d’évaluation en santé cherchent à mesurer

Les approches récentes élargissent progressivement les dimensions évaluées.

L’objectif n’est plus uniquement de savoir : “l’intervention fonctionne-t-elle ?”

Mais également :

pour qui ?
dans quelles conditions ?
avec quels mécanismes ?
avec quelle transférabilité ?
avec quel maintien dans le temps ?
avec quels effets indirects ?
avec quelles inégalités potentielles ?

Cette évolution rapproche :

les sciences comportementales,
la recherche interventionnelle,
la santé publique,
l’évaluation économique,
les sciences de l’implémentation.

Comparatif des principaux modèles d’évaluation en santé utilisés aujourd’hui

Modèle d’évaluation	Ce qui est principalement mesuré	Acteurs utilisateurs principaux	Point fort	Limite principale
Essais contrôlés randomisés (RCT)	Efficacité causale	Recherche clinique, médicaments, HAS, FDA	Forte robustesse interne	Faible transférabilité réelle
Études observationnelles	Associations en vie réelle	Santé publique, épidémiologie	Conditions réelles	Risque de biais
Évaluation médico-économique	Coût / efficacité	HAS, assureurs, OCDE	Aide à la décision	Difficulté à mesurer les effets longs
Évaluation comportementale	Adoption et maintien des comportements	Sciences comportementales, prévention	Compréhension des mécanismes	Mesures souvent complexes
Sciences de l’implémentation	Conditions de déploiement réel	Santé publique, OMS, recherche interventionnelle	Analyse du passage à l’échelle	Méthodes hétérogènes
Mesures numériques d’engagement	Usage, activité, rétention	Start-up e-santé, plateformes numériques	Simplicité et rapidité	Confusion fréquente avec l’impact réel
Outcomes cliniques et populationnels	Morbidité, mortalité, incidence	Santé publique, systèmes de santé	Impact réel	Temporalité longue et coûteuse
Évaluation systémique	Interactions entre niveaux	OMS, politiques publiques	Vision globale	Difficulté méthodologique élevée

Le problème majeur : la temporalité du changement

La plupart des indicateurs numériques mesurent :

des effets rapides,
visibles,
facilement quantifiables.

Or les transformations comportementales et populationnelles reposent sur :

des temporalités longues,
des effets indirects,
des dynamiques cumulatives,
des interactions complexes.

Par exemple :

un téléchargement peut être immédiat,
un changement durable d’activité physique nécessite parfois plusieurs années,
une réduction d’incidence cardiovasculaire peut prendre une décennie.

Cette asymétrie favorise mécaniquement les outils capables de produire des indicateurs rapides, même lorsque leur impact réel reste limité.

Ce que la HAS souligne désormais explicitement

Le rapport HAS 2025 insiste sur plusieurs dimensions souvent sous-évaluées :

transférabilité,
acceptabilité,
maintien,
équité,
externalités,
implémentation,
contexte social et environnemental.

Autrement dit : une intervention ne doit plus être évaluée uniquement sur son efficacité théorique, mais sur sa capacité réelle à produire un bénéfice durable dans des contextes réels.

Cette évolution est particulièrement importante pour :

la prévention,
les comportements santé,
la santé numérique,
l’IA,
les politiques populationnelles.

Exemple concret : pourquoi certaines applications santé semblent efficaces… sans modifier les trajectoires

De nombreuses applications santé montrent :

un engagement initial élevé,
des taux de satisfaction importants,
des améliorations à court terme.

Mais plusieurs méta-analyses récentes montrent également :

une forte attrition,
des effets modestes,
des difficultés de maintien,
peu de données sur les outcomes cliniques à long terme.

Le problème n’est donc pas uniquement : “l’application fonctionne-t-elle ?”

Mais :

combien de temps ?
chez quelles populations ?
dans quelles conditions ?
avec quel maintien ?
avec quels effets réels sur les trajectoires ?

Vers une nouvelle génération d’évaluation

Les modèles émergents convergent progressivement vers une logique plus intégrée.

Une intervention efficace ne peut plus être évaluée uniquement sur :

l’usage,
l’engagement,
la satisfaction,
ou même certains effets intermédiaires.

L’évaluation doit intégrer :

les comportements réels,
le maintien,
les déterminants,
les conditions d’implémentation,
les inégalités,
l’impact populationnel,
les effets à long terme.

Autrement dit : la question centrale devient moins : “l’intervention fonctionne-t-elle ?” que : “dans quelles conditions transforme-t-elle réellement les trajectoires de santé ?”.

Conclusion

La prévention, la santé numérique et l’IA ne souffrent plus uniquement d’un manque de preuves.

Elles souffrent aussi d’une crise des modèles d’évaluation.

Les indicateurs dominants restent souvent centrés sur :

l’attention,
l’usage,
l’engagement,
la satisfaction,
beaucoup plus que sur :
la transformation durable des comportements,
la réduction réelle des risques,
l’impact populationnel.

Les publications récentes de la HAS, de l’OMS et de la littérature scientifique convergent vers une évolution importante : évaluer une intervention ne consiste plus uniquement à démontrer qu’elle fonctionne en théorie, mais à comprendre sa capacité réelle à transformer durablement des trajectoires dans des environnements complexes.

Références bibliographiques

Craig, P., et al. (2008). Developing and evaluating complex interventions: The new Medical Research Council guidance. BMJ, 337, a1655. https://doi.org/10.1136/bmj.a1655

Haute Autorité de Santé. (2025). How can we strengthen expertise to foster a paradigm shift in disease prevention? HAS.

Maddox, T. M., et al. (2024). Randomised controlled trials evaluating artificial intelligence in clinical practice: A systematic review. The Lancet Digital Health. https://doi.org/10.1016/S2589-7500(24)00047-5

Sheeran, P., & Webb, T. L. (2023). The intention–behavior gap. Annual Review of Psychology, 74, 291–318.

Skivington, K., et al. (2021). A new framework for developing and evaluating complex interventions. BMJ, 374, n2061. https://doi.org/10.1136/bmj.n2061

World Health Organization. (2021). Evidence-informed decision-making for health policy and systems.

A lire également : Santé numérique, IA, INM : où vont réellement les investissements santé en 2026 ?

Bibliographie

Aucune resource

Deniers articles publiés :

De l’économie de l’attention à l’économie de l’attachement : les IA conversationnelles changent-elles la nature de la santé numérique ?

2 juillet 2026

Lire l'article »

Le mythe du patient moyen : pourquoi les interventions de prévention produisent des effets différents selon les profils psychologiques

24 juin 2026

Lire l'article »

Mortalité en France : pourquoi les maladies chroniques pèsent encore plus lourd qu’avant la pandémie

24 juin 2026

Lire l'article »

Multimorbidité : pourquoi sa prévalence varie de 1 % à 35 % selon la définition utilisée

17 juin 2026

Lire l'article »

Articles les plus populaires

Analyse de la tendance de consommation de médicaments des Français : Une perspective scientifique

Dans le même thème

Innovation en santé : avons-nous réduit l’in...

Segmentation en santé : la capacité plutôt que l’â...

Pourquoi les risques de santé ne sont pas répartis...

Arrêts de travail, santé mentale et maladies chron...

Ce que les patients attendent réellement des techn...

Pourquoi les institutions parlent de trajectoires ...

Comment évaluer réellement l’impact d’une intervention en prévention, santé numérique ou IA santé ?

Sommaire

Pourquoi les modèles classiques d’évaluation des dispositifs de santé deviennent insuffisants

Pourquoi les essais classiques (RCT) ne suffisent plus

Une confusion structurelle en santé : engagement, efficacité et impact réel

Comment mesurer la capacité réelle d’une intervention à transformer durablement des trajectoires de santé ?

Ce que les nouveaux modèles d’évaluation en santé cherchent à mesurer

Comparatif des principaux modèles d’évaluation en santé utilisés aujourd’hui

Le problème majeur : la temporalité du changement

Ce que la HAS souligne désormais explicitement

Exemple concret : pourquoi certaines applications santé semblent efficaces… sans modifier les trajectoires