«Nucleotide Transformer», une solution d’intelligence artificielle développée par InstaDeep en collaboration avec Nvidia et l’Université technique de Munich, est le modèle d’IA génomique le plus téléchargé au monde, selon la publication de Karim Beguir, cofondateur et CEO d’InstaDeep.
En effet, cette solution constitue une série de modèles de langage conçus pour l’analyse des séquences d’ADN. Ces modèles ont été entraînés sur des nœuds DGX A100, qui sont des unités de traitement puissantes, sur le superordinateur Cambridge-1. Ils se distinguent par leur capacité à intégrer des séquences issues non seulement d’un seul génome de référence, mais aussi de plus de 3 200 génomes humains diversifiés et de 850 génomes d’une grande variété d’espèces.
Parmi cette collection, le modèle nucleotide-transformer-v2-500m-multi-species est particulièrement notable. C’est un modèle puissant doté de 500 millions de paramètres, pré-entraîné sur une collection exhaustive de génomes provenant d’un large éventail d’espèces. L’entraînement de ce modèle sur un spectre aussi vaste de données génétiques garantit sa polyvalence et sa précision pour les analyses génomiques.