La startup tunisienne InstaDeep vient d’annoncer aujourd’hui le développement, en partenariat avec BioNTech, d’un nouvel algorithme qui analyse les données de séquençage disponibles dans le monde entier et prédit les variantes à haut risque du SRAS-CoV-2. Le système d’alerte précoce (EWS) développé en collaboration par BioNTech et InstaDeep est basé sur des métriques d’échappement immunitaire et de fitness calculées par intelligence artificielle (IA).
La nouvelle méthode combine la modélisation structurelle de la protéine virale Spike et des algorithmes d’intelligence artificielle pour signaler rapidement, en moins d’un jour, les variantes potentielles à haut risque entrées dans les dépôts de données de séquences du SRAS-CoV-2, sur la base de paramètres évaluant leur aptitude (par exemple, l’interaction entre la protéine ACE2 et la variante Spike) ainsi que leurs propriétés d’échappement immunitaire. Les entreprises ont validé ces prédictions à l’aide de données expérimentales générées en interne et de données accessibles au public.
Au cours de la période d’essai, le système a identifié plus de 90 % des variantes désignées par l’Organisation mondiale de la santé (OMS) (Variants of Concern, VOC ; Variants of Interest, VOI ; Variants Under Monitoring, VUM) en moyenne deux mois à l’avance. Les variantes Alpha, Beta, Gamma, Theta, Eta et Omicron désignées par l’OMS ont été détectées par le SAP la semaine même où leur séquence a été téléchargée pour la première fois. La variante Omicron a été classée comme variante à haut risque le jour même où sa séquence est devenue disponible. La variante IHU observée en France a également été évaluée par le SAP, qui a mis en évidence des propriétés d’échappement immunitaire relativement similaires à celles d’Omicron, mais avec une fitness nettement inférieure, ce qui la rend moins préoccupante au vu des données actuelles.
Les résultats de l’étude soulignent que le SAP est capable d’évaluer de nouvelles variantes en quelques minutes et de surveiller les lignées de variantes en temps quasi réel. Il est également entièrement évolutif à mesure que de nouvelles données sur les variantes deviennent disponibles.
“Grâce aux méthodes de calcul avancées que nous avons développées au cours des derniers mois, nous pouvons analyser les informations sur la séquence de la protéine Spike et classer les nouveaux variants en fonction de leur score prédit d’échappement immunitaire et de liaison à ACE2”, a déclaré Ugur Sahin, M.D., directeur général et cofondateur de BioNTech. “Le repérage précoce des variantes potentielles à haut risque pourrait être un outil efficace pour alerter les chercheurs, les développeurs de vaccins, les autorités sanitaires et les décideurs, offrant ainsi plus de temps pour répondre aux nouvelles variantes préoccupantes.”
“Plus de 10 000 nouvelles séquences de variantes sont actuellement découvertes chaque semaine et les experts humains ne peuvent tout simplement pas faire face à des données complexes à cette échelle. Nous avons relevé ce défi en déployant les puissantes capacités d’IA de la plateforme DeepChain d’InstaDeep, combinées au savoir-faire et à la technologie de BioNTech en matière de SRAS-CoV-2. Pour la première fois, les variantes à haut risque ont pu être détectées sur place, ce qui a permis de gagner des mois de temps précieux. Nous sommes heureux de mettre nos travaux de recherche à la disposition du public et, surtout, nous nous réjouissons de leur impact continu dans le monde réel”, a ajouté Karim Beguir, cofondateur et PDG d’InstaDeep.
Le système d’alerte précoce (EWS) repose sur deux approches : (1) la modélisation structurelle de l’interaction du domaine de liaison au récepteur (RBD) de la protéine de pointe virale avec le récepteur de la cellule hôte et l’évaluation de l’impact de la variante du virus dans l’échappement à la réponse immunitaire, et (2) la modélisation prédictive basée sur l’IA pour extraire des informations de centaines de milliers de variantes de virus enregistrées à partir de référentiels de séquences mondiaux. Le SAP calcule un score d’échappement immunitaire et un score préalable de fitness (potentiel de transmissibilité). Alors que le score d’échappement immunitaire seul était déjà hautement prédictif du risque, la combinaison de ces deux paramètres en un score de Pareto a fourni la meilleure évaluation du risque posé par une variante virale donnée. Plus le score est élevé, plus le risque que la variante ait un impact sur la santé mondiale est important. L’approche du SAP classe les variantes du SRAS-CoV-2 en fonction de leur potentiel d’échappement immunitaire et de leur capacité à s’adapter, en se basant uniquement sur les données existantes, et ne dépend donc pas d’une approche ” attentiste “.