Un consortium émanant de hautes écoles suisses a mis en place un tableau de bord fournissant quotidiennement des prévisions épidémiologiques à 7 jours pour 209 pays et territoires dans le monde. Relayées sur les réseaux sociaux, les médias internationaux et les sites des grandes agences de sécurité sanitaire, ces prévisions peuvent aider au guidage des politiques publiques. Cependant l’horizon de temps de ces prévisions est limité et leur précision parfois questionnable, même à 7 jours. Des pistes sont proposées à travers une recherche interdisciplinaire visant à complexifier les modèles mathématiques pour améliorer la précision des prévisions fournies.
Un consortium constitué d’équipes de l’Université de Genève, du Swiss TPH, des Écoles polytechniques fédérales de Zurich et de Lausanne, du Swiss Data Science Center (SDSC) des deux Écoles polytechniques fédérales, des Universités de Bâle, de Lausanne, de Zurich et de Berne s’était préparé pendant plus de 2 ans à l’une des plus difficiles compétitions nationales en matière de recherche, un appel à projets du Fonds national de la recherche scientifique (FNRS) visant la création de pôles de recherche nationaux (PRN). Les PRN sont dotés de l’ordre de cent millions de francs sur 4 ans si l’on inclut la participation des universités porteuses. La phase d’élaboration du projet avait été soutenue dès l’origine par la Fondation Rockefeller (séminaire de Bellagio, Italie, novembre 2017).1 Le thème du séminaire portait sur les prévisions de précision des épidémies de maladies infectieuses émergentes.2-4 Le projet a été présélectionné pour une audition à Berne le 10 avril 2019 qui, après une session de questions et de réponses, s’est conclue par une standing ovation du jury, pour applaudir et dire « au revoir » à la délégation du projet.5 Généralement les auditions des projets scientifiques sont moins démonstratives, mais personne ne devait revoir les membres du jury. Le projet n’a pas été retenu par le FNRS. La compétition scientifique est féroce et, s’il semblait avoir passé l’une des dernières haies, il n’avait visiblement pas su convaincre de lui voir attribuer la manne publique. Il restait à s’incliner devant la décision, tous profondément déçus, mais conscients des dures règles du jeu.
Nous ne nous imaginions pas cependant que cette décision priverait le pays d’un instrument qui se serait révélé d’une très grande utilité lorsque la pandémie de Covid-19 a déferlé sur l’Europe en entrant par le Tessin. Nous allions regretter de ne pas disposer de la cinquantaine de postdoctorants que nous prévoyions d’embaucher dans les domaines de l’épidémiologie, la modélisation mathématique, la virologie, l’immunologie, l’intelligence artificielle, le machine learning, la sociologie, l’anthropologie, l’éthique, l’économie, la communication, la génétique, la médecine vétérinaire et les sciences de l’environnement. Mais nous n’allions pas regretter d’avoir su tisser au cours de ces 2 années de préparation un solide réseau de collègues, devenus des amis, avec lesquels nous pourrions, sans disposer des moyens prévus, mettre en œuvre dans le feu de l’action et la fulgurance de la première vague épidémique des pans entiers des projets que nous avions discutés ensemble, élaborés, imaginés. Dès le démarrage de la pandémie, début janvier 2020, nous avons analysé les premières données officielles rapportées quotidiennement sur internet par la Chine, puis la Thaïlande, Hong Kong, Taïwan, le Japon, l’Australie. Rapidement, nous avons créé sur Twitter un premier fil de prévisions épidémiologiques empiriques quotidiennes, fondé sur l’observation du temps de doublement des cas, à partir d’un modèle exponentiel, courant lors de démarrages épidémiques. Ce fil n’allait pas s’arrêter d’être publié sur Twitter, mais allait considérablement s’enrichir grâce à une collaboration fructueuse établie entre l’Institut de santé globale et le SDSC des deux Écoles polytechniques fédérales et soutenue par les institutions mères et la Fondation privée des HUG. Un tableau de bord ouvert allait voir le jour sur internet, fournissant nos prévisions à l’ensemble des pays et territoires rapportant des données.6 Deux bases de données allaient être sélectionnées pour participer à ces prévisions quotidiennes, celle de l’European Center for Disease Control and Prevention (ECDC) et celle de la Johns Hopkins University (JHU). Le 15 décembre 2019, l’ECDC allait stopper sa surveillance quotidienne et la remplacer par une surveillance hebdomadaire, mais heureusement la JHU allait poursuivre sa mission et certains pays, dont la Suisse, allaient nous fournir en complément des données régionales fort précieuses.
Cinq spécialistes en sciences des données du SDSC évaluent en permanence un ensemble de modèles existants de prévisions épidémiologiques à la recherche avec des techniques de machine learning des meilleurs algorithmes pour prévoir les tendances à partir des données rapportées. Nous proposons des prévisions quotidiennes à 7 jours – parce qu’aucun modèle connu à ce jour ne nous semble apte à prédire au-delà – pour chacun des 209 pays et territoires rapportant officiellement des données sur les tests réalisés, les nombres de cas confirmés de Covid-19, les nombres de décès attribués à cette pandémie. Nous dressons des cartes de risque quotidiennes (figures 1A et B). Nous calculons pour chaque pays et territoire, tous les jours, la valeur du taux de reproduction effectif (Re) qui est devenu l’un des instruments les plus utilisés pour la conduite et l’évaluation en temps réel des politiques publiques de riposte contre la pandémie.
Nous avons systématiquement évalué la précision de nos prévisions épidémiologiques, et cette analyse nous permet d’améliorer constamment nos modèles. Certaines erreurs de prévisions nous ont néanmoins permis de tirer d’importantes leçons sur de nouvelles sources de données qui pourraient être utilisées. Ainsi lorsque le gouvernement irlandais a décidé un deuxième confinement général du pays, le 21 octobre 2020 (figure 2A), tous nos modèles prévoyaient, devant la courbe exponentielle d’une épidémie galopante, la poursuite de la tendance pour les 7 jours à venir. On estimait qu’il fallait environ 2 semaines pour que des mesures puissent faire effet, en raison des délais d’incubation, du temps de génération, de l’inertie même du phénomène épidémique parti sur sa lancée. Or 4 jours après, le 25 octobre (figure 2B), la courbe s’était déjà fortement aplatie, l’exponentielle avait cassé, les autorités semblaient avoir repris le contrôle sur l’épidémie. Comment fut-il possible qu’en seulement 4 jours la courbe évolue ainsi ? Nous sommes allés regarder les données de mobilité des Irlandais (figures 3A et B) qui permettent de constater que la population s’était en réalité « autoconfinée » chez elle plusieurs semaines avant la décision gouvernementale, puisque le 4 octobre, une réduction de plus de 40 % sur l’utilisation des transports publics est observée en Irlande.7 Or, ce type de données, ouvertes et accessibles, n’était pas utilisé dans nos modèles en routine, alors qu’elles pouvaient fournir d’utiles renseignements et permettre de renforcer la précision de nos prévisions.
Les déterminants de la transmission du SARS-CoV-2 ont été connus progressivement au cours de la pandémie. Pour en citer quelques-uns, nous évoquions la mobilité de la population, des données comportementales donc, liées au niveau de perception du risque, qui, si elles étaient mesurées et intégrées, pourraient contribuer à améliorer la valeur prédictive des modèles. L’émergence de nouveaux variants plus transmissibles, éventuellement plus virulents (en termes de sévérité et donc de mortalité), devrait être prise en compte. La pollution atmosphérique en particules fines8 a montré avoir joué un rôle également, tout comme certaines variations météorologiques.9 La proportion de la population immunisée, naturellement ou par le vaccin, représente un frein qu’il conviendrait de prendre en compte, tout comme le recours aux gestes barrières, les mesures totales ou partielles de confinement. L’un des défis est celui de la disponibilité de telles données à l’échelle internationale et donc possiblement d’une coordination par l’OMS, par exemple, du recueil de ces données pour permettre la prévision épidémiologique de précision.10
Si gouverner c’est anticiper, alors tenir un cap avec précision dans la riposte contre cette pandémie demande de disposer de capacités d’anticipation précises. Aujourd’hui, nous ne pouvons pas faire de prévisions au-delà de 7 jours et nous avons montré que même à cet horizon nous pouvons échouer à prédire avec précision. Mais les erreurs sont au moins aussi utiles que les succès, car elles peuvent, outre mieux prédire, permettre de davantage comprendre les rouages de la décision publique en régime démocratique, le rôle de la participation citoyenne anticipant les décisions de son gouvernement dans le cas de l’Irlande, et parfois aussi l’influence et l’impact de déterminants parfois sous-estimés, comme le rôle des variants du virus ou celui des pics de pollution atmosphérique dans la survenue de flambées épidémiques.
Les auteurs n’ont déclaré aucun conflit d’intérêts en relation avec cet article.
• Aujourd’hui les modèles mathématiques utilisés en routine ne permettent pas d’établir des prédictions très au-delà de 7 jours de l’évolution du Covid-19
• L’intégration de données complémentaires (par exemple, comportementales et sociologiques, environnementales et climatiques, génétiques) permettrait de produire des prévisions plus précises et fiables
A consortium of Swiss universities has set up a dashboard providing daily 7-day epidemic forecasting for 209 countries and territories around the world. Relayed on social networks, international media, and the sites of major public health agencies, these forecasts can help guiding public policy. However, the time horizon of these forecasts is limited and their accuracy is sometimes questionable, even at 7 days. Interdisciplinary research aimed at increasing the complexity of mathematical models can improve the accuracy of the forecasts provided.