Découvrir

Tout comprendre à DeepSeek, l’IA chinoise qui déstabilise la Silicon Valley

Le 20 janvier 2025, une start-up chinoise jusque-là méconnue, DeepSeek, a dévoilé son modèle d’intelligence artificielle, DeepSeek-R1, bouleversant l’équilibre des forces dans le monde de l’IA, largement dominé par les États-Unis. Avec un coût de développement estimé à seulement 6 millions de dollars, ce modèle rivalise avec les technologies des géants américains comme OpenAI (ChatGPT), Google (Gemini), Microsoft (Copilot), Amazon (Nova) ou encore Anthropic (Claude), qui ont investi des milliards de dollars pour créer leurs propres modèles. À titre de comparaison, OpenAI investit quelque 5 milliards de dollars par an pour développer ses IA. Le fossé est réel. Pourtant, dès sa sortie, le chatbot DeepSeek a impressionné par ses performances et rapidement grimpé à la première place des téléchargements gratuits sur l’App Store, surpassant même ChatGPT.

Cet exploit a ébranlé les marchés : hier, lundi 27 janvier, les actions de Nvidia ont chuté de 17 % en une journée, effaçant près de 590 milliards de dollars de sa valeur boursière, tandis que les titres de Microsoft et d’Amazon reculaient eux aussi. En quelques jours, DeepSeek a imposé son nom et son modèle comme une alternative crédible et économique, captant l’attention d’une industrie habituée aux mastodontes américains. Même Satya Nadella, PDG de Microsoft, a déclaré lors du Forum économique mondial de Davos, en Suisse : “Le nouveau modèle de DeepSeek est vraiment impressionnant, car il montre à la fois l’efficacité du modèle open source qui permet de réaliser des calculs en temps réel et une efficacité de calcul exceptionnelle. » Et d’ajouter : “Nous devons prendre très au sérieux les avancées venues de Chine.”

Une stratégie d’innovation née de la contrainte

L’ascension de DeepSeek est indissociable des restrictions à l’exportation américaines sur les technologies de pointe. Depuis 2022, la Chine fait face à un embargo limitant son accès aux puces Nvidia H100, essentielles pour entraîner des modèles d’IA. Contrairement à des entreprises comme OpenAI, qui s’appuient sur des superordinateurs comprenant des dizaines de milliers de puces, DeepSeek a dû innover avec des ressources limitées.

La start-up s’est appuyée sur son stock stratégique de 10 000 puces Nvidia A100, accumulé par High-Flyer, le hedge fund chinois qui a donné naissance à DeepSeek. Grâce à des méthodes novatrices comme le Mixture-of-Experts et le Multi-head Latent Attention (MLA), l’entreprise a réduit les besoins en calculs massifs. Ces techniques ont permis à DeepSeek de rivaliser avec des modèles comme GPT-4 tout en nécessitant dix fois moins de ressources matérielles. Dans le benchmark mathématique AIME 2024, DeepSeek R1 a obtenu un score de 79,8 % et OpenAI o1 un score de 79,2 %. Dans le benchmark MATH-500, DeepSeek R1 a obtenu un score de 97,3 % et OpenAI o1 un score de 96,4 %.

La preuve que, quand on n’a pas de moyens, on a des idées. Ce que confirme à Wired, Wendy Chang, analyste au Mercator Institute for China Studies : “DeepSeek a optimisé l’architecture de son modèle en utilisant une batterie d’astuces techniques : des schémas de communication personnalisés entre les puces, la réduction de la taille des champs pour économiser de la mémoire et une utilisation innovante de l’approche de mélange de modèles. La plupart de ces approches ne sont pas des idées nouvelles, mais les combiner avec succès pour produire un modèle de pointe est un exploit remarquable.”

Une révolution open source

L’un des principaux atouts de DeepSeek est son modèle open source, une philosophie qui contraste avec les approches fermées et propriétaires des géants américains. En rendant publiques les innovations de ses modèles, DeepSeek a attiré une communauté mondiale de développeurs et de chercheurs, accélérant ainsi son développement.

Cette stratégie open source repose sur un pragmatisme assumé. En partageant ses modèles, DeepSeek espère non seulement élargir son écosystème, mais aussi compenser son retard technologique face aux géants occidentaux. Le Français Yann Le Cun, expert en la matière et AI Chief Scientist chez Meta (Facebook, etc.), a souligné l’ingéniosité des équipes chinoises en la matière. “Pour ceux qui voient les performances de DeepSeek et pensent : ‘La Chine surpasse les États-Unis en matière d’IA », vous faites une erreur. La bonne lecture est : ‘Les modèles open source surpassent les modèles propriétaires.'”, a-t-il déclaré sur son compte LinkedIn.

Des performances impressionnantes, mais des limites inquiétantes

Lors des premiers tests, DeepSeek-R1 a impressionné par ses capacités. Le modèle surpasse ses concurrents sur des benchmarks de mathématiques, de programmation et de logique, tout en affichant des temps de réponse plus rapides que ceux de ChatGPT. En outre, ses réponses génèrent moins d’hallucinations (erreurs de contenu) dans les tâches techniques.

Cependant, ces performances ont leurs limites. DeepSeek se montre moins performant dans des domaines créatifs comme la rédaction de poèmes ou la génération d’histoires. Pire encore, il est incapable de traiter des questions sensibles liées à la Chine. À la question sur le massacre de Tiananmen, le chatbot répond :
“Cette information dépasse mon champ de compétence.” Même chose quand on vient titiller l’IA sur la dictature chinoise : no comment. Quant à Taïwan, l’IA affirme que le petit État insulaire indépendant fait bel et bien partie de la République Populaire de Chine.

La réponse de DeepSeek (disponible uniquement en chinois et en anglais pour l’heure) sur les liens entre Taïwan et la Chine. Crédit : DeepSeek.

Des questions sur les Ouïghours ou la corruption politique génèrent des messages d’erreur ou des refus implicites, parfois déguisés sous des prétextes de trafic élevé. Certains utilisateurs ont trouvé des moyens de contourner cette censure, notamment en modifiant leurs requêtes avec des caractères spéciaux. Cependant, ces astuces soulignent l’influence persistante du gouvernement chinois sur les technologies nationales.

Une start-up atypique, fruit de High-Flyer et de son fondateur Liang Wenfeng

D’où vient concrètement DeepSeek ? L’IA est née d’une initiative de High-Flyer, un hedge fund chinois spécialisé dans le trading quantitatif. Fondé en 2015, ce fonds a utilisé ses ressources pour financer la recherche en IA, stockant des puces Nvidia et construisant des superordinateurs pour analyser les marchés financiers.

En 2023, son CEO, Liang Wenfeng, le cerveau de DeepSeek, a décidé de se lancer dans l’intelligence artificielle, motivé par un intérêt scientifique plutôt que par des ambitions commerciales. Il explique au site chinois 36kr : “La recherche fondamentale n’a pas de rentabilité immédiate. Mais c’est en poursuivant ces défis que nous pouvons faire avancer la technologie.” Il a aussi détaillé le portrait-robot des employés de DeepSeek : “Il s’agit de jeunes diplômés d’universités prestigieuses, de doctorants en quatrième ou cinquième année qui n’ont pas encore obtenu leur diplôme, et de quelques jeunes diplômés depuis quelques années seulement.”

Liang Wenfeng a délibérément recruté des doctorants, jeunes et ambitieux, issus des meilleures universités chinoises, comme Tsinghua, Beijing, Shanghai, Zhejiang, Ningbo, Yulin, Chengdu… Plutôt que des stars du milieu, il préfère des profils sans grande expérience professionnelle (3 à 5 ans au maximum) mais des diamants bruts du secteur. Ce choix a favorisé une culture d’innovation et de collaboration, où les chercheurs disposent de ressources abondantes pour mener des projets expérimentaux.

Des enjeux géopolitiques et éthiques

Le succès de DeepSeek remet en question la domination des entreprises américaines dans le domaine de l’IA. Avec un coût d’utilisation imbattable — 0,14 $ par million de tokens pour l’API R1 contre 7,50 $ pour OpenAI —, DeepSeek pourrait séduire des entreprises cherchant des alternatives économiques. Cependant, l’émergence de DeepSeek met également en lumière les faiblesses des restrictions américaines. Si ces embargos visaient à freiner la progression chinoise, ils ont paradoxalement stimulé l’innovation en obligeant les entreprises à optimiser leurs ressources. Une situation que le nouveau président américain Donald Trump parle comme d’un “signal d’alarme” pour les entreprises américaines qui doivent se concentrer sur “la concurrence pour gagner”. Pas de doute, DeepSeek représente une menace pour l’influence américaine.

Cette IA incarne une nouvelle phase dans la compétition technologique sino-américaine. Bien que ses modèles soient techniquement impressionnants, leur adoption mondiale est entravée par des préoccupations liées à la censure et à la transparence. Des experts craignent que l’essor de modèles influencés par des régimes autoritaires ne redéfinisse les standards éthiques de l’industrie. En matière d’IA en Chine, chaque système doit fonctionner dans le cadre de l’Administration du Cyberespace de Chine (CAC), le puissant régulateur de tous les sujets qui touchent au numérique. Les règles de la CAC sont claires : tout modèle d’IA déployé en Chine doit activement défendre les valeurs fondamentales du socialisme et éviter de générer du contenu qui pourrait remettre en cause l’autorité de l’État ou l’ordre public.

L’avenir de DeepSeek : promesses et défis

DeepSeek a prouvé qu’une petite start-up pouvait bouleverser les géants de l’IA avec une approche basée sur l’efficacité et la collaboration. Cependant, son avenir dépendra de sa capacité à répondre aux attentes internationales en matière de transparence et de neutralité.

Pour l’instant, DeepSeek incarne une vision alternative de l’innovation, où des ressources limitées peuvent mener à des avancées majeures. Mais au-delà de son rôle de “petit poucet”, l’entreprise devra choisir entre collaboration mondiale et alignement politique. Une chose est sûre : DeepSeek n’a pas fini de faire parler d’elle. Et de faire tousser la Silicon Valley comme la bourse américaine.

SOUTENEZ WE DEMAIN, SOUTENEZ UNE RÉDACTION INDÉPENDANTE
Inscrivez-vous à notre newsletter hebdomadaire
et abonnez-vous à notre magazine.