Avez-vous entendu parler de R1 ? Ce modèle IA intelligent d'une start-up chinoise du continent, DeepSeek, vient de placer la barre plus haut pour les grands modèles de langage (LLMs). Une première dans le domaine : le travail de R1 a été examiné de près avec une évaluation formelle par les pairs, publiée dans Nature ce mercredi.
Comme le dit Lewis Tunstall, ingénieur en apprentissage automatique chez Hugging Face qui a examiné l'étude : "C'est un précédent très bienvenu. Si nous ne partageons pas une grande partie de ce processus publiquement, il devient très difficile d'évaluer si ces systèmes présentent des risques ou non."
Lancé en janvier, R1 a été conçu comme un marathonien pour relever des défis de raisonnement difficiles – pensez à des problèmes mathématiques complexes et à des énigmes de codage. Et le meilleur ? C'est un champion économique par rapport à ses pairs issus des géants technologiques américains.
Grâce à sa licence open-weight, vous pouvez télécharger R1 directement depuis Hugging Face – où il a déjà enregistré plus de 10,9 millions de téléchargements, soit plus que tout autre LLM disponible gratuitement.
L'évaluation de Nature a salué l'approche novatrice de DeepSeek en IA : au lieu de simplement copier des exemples créés par des humains, R1 a appris par pur apprentissage par renforcement. Il a reçu des récompenses pour des réponses exactes, un peu comme les joueurs qui gagnent des points pour des mouvements impeccables.
L'étude a également dévoilé les chiffres : l'entraînement de R1 a coûté seulement environ 294 000 $ – une fraction des dizaines de millions généralement nécessaires. Et si l'on compte les 6 millions de dollars investis pour construire sa fondation, cela reste une bonne affaire dans le monde de l'IA, suffisant pour financer un hackathon communautaire ou un camp de formation au codage dans de nombreuses villes.
DeepSeek a même appris à R1 à critiquer son propre travail en utilisant une astuce appelée optimisation de la politique relative de groupe. Pensez-y comme à une IA qui se donne elle-même des ajustements précis, plutôt que de faire appel à un autre algorithme.
Maintenant, des chercheurs du monde entier empruntent le manuel de DeepSeek, essayant d'améliorer les modèles d'IA existants et d'explorer de nouveaux domaines au-delà des mathématiques et du codage. Comme le dit Tunstall, R1 a "déclenché une révolution."
Dans un domaine où le secret règne souvent, l'évaluation publique de R1 établit un précédent encourageant. Cela montre que partager le processus ouvertement pourrait être la clé pour équilibrer innovation et sécurité – un enjeu important partout, de Lagos à Lima.
Reference(s):
DeepSeek's R1 sets benchmark as first peer-reviewed major AI LLM
cgtn.com