Déchiffrer  > Moins de puissance, plus d’intelligence : le pari de l’IA frugale

Written by 17 h 38 min Déchiffrer, Inventer, Tech-Sciences

Moins de puissance, plus d’intelligence : le pari de l’IA frugale

En réponse aux infrastructures XXL, aux investissements délirants et à la consommation énergétique colossale, une nouvelle tendance émerge : l’IA frugale. Plus légère, plus rapide et capable de fonctionner en local, elle pourrait bien révolutionner le secteur.

Le 19/03/2025 par Florence Santrot
IA frugale

Si l’intelligence artificielle est encore aujourd’hui synonyme de puissance brute, l’IA est en train de vivre une révolution silencieuse. Loin des data centers massifs et des processeurs hors de prix, une nouvelle tendance émerge : l’IA frugale. Plus légère, plus rapide et capable de fonctionner en local, elle pourrait bien transformer notre rapport à l’IA. L’idée est simple : développer des modèles d’IA qui n’ont pas besoin d’une infrastructure titanesque pour fonctionner. Plus efficaces, optimisés pour des performances équivalentes avec moins de calculs, ces nouveaux modèles permettent une exécution locale. À la clé, la possibilité de faire tourner une IA avancée sur votre ordinateur personnel, sans connexion Internet. C’est le cas du modèle chinois DeepSeek ou encore, lancée il y a quelques jours, d’une version du Chat du français Mistral.

Parallèlement, des avancées matérielles notables, comme les nouvelles superpuces de Nvidia, redéfinissent les capacités des systèmes informatiques pour limiter la consommation d’électricité. Autant d’évolutions qui pourraient bien transformer notre rapport à l’IA. et éviter la gabegie énergétique annoncée. Car les experts, comme Hugues Ferreboeuf, chef de projet numérique au Shift Project, nous mettent en garde : “En 2030, les data centers absorberont près de 10 % de l’électricité mondiale selon les projections actuelles.”

Mistral AI et DeepSeek : des modèles efficients et la possibilité d’un usage en local

Deux exemples récents illustrent cette tendance vers l’IA frugale : Mistral Small 3.1 et DeepSeek R1. Le premier, Mistral Small 3.1, développé par la start-up française Mistral AI et lancé le 17 mars dernier, affiche 24 milliards de paramètres, un chiffre impressionnant pour un modèle conçu pour tourner en local. Il peut fonctionner avec une machine dotée d’une carte graphique puissante comme la GeForce RTX 4090 de l’américain Nvidia ou sur un ordinateur de type Mac Studio M3 Ultra (32 Go de RAM sont nécessaires), rendant l’IA plus accessible à ceux disposant de machines haut de gamme, mais domestiques.

DeepSeek R1, de son côté, bouleverse les attentes en proposant des performances comparables à GPT-4 avec seulement 32 processeurs graphiques (GPU), contre des milliers pour les premiers modèles d’OpenAI. Une claque technologique qui réduit drastiquement les besoins matériels et ouvre la voie à une démocratisation des modèles d’IA de pointe.

Comment ces deux solutions conservent leurs performances en local ? C’est notamment grâce à une optimisation poussée de leurs modèles, réduisant ainsi le nombre de calculs nécessaires sans sacrifier la précision. Toutefois, ces solutions nécessitent encore du matériel haut-de-gamme (notamment au niveau des cartes graphiques) pour fonctionner. En outre, ces solutions ne remplacent pas totalement les modèles cloud pour certaines tâches complexes comme la génération vidéo ou les calculs avancés.

IA frugale : faire mieux avec moins

Pourquoi ce virage vers l’IA frugale ? Plusieurs raisons expliquent cette mutation.

  1. La souveraineté numérique : Avec des modèles locaux, les entreprises européennes peuvent mieux protéger leurs données et se libérer de leur dépendance aux GAFAM.
  2. L’efficacité énergétique : Faire tourner une IA sur un seul processeur consomme nettement moins d’électricité que de mobiliser une ferme de serveurs (data centers).
  3. L’accessibilité : Des besoins réduits en ressources cloud signifie des coûts limités et une utilisation plus facile pour les petites structures et les particuliers.
  4. Une IA embarquée : L’IA frugale ouvre la porte à des modèles embarqués dans des objets du quotidien, comme les voitures connectées, les smartphones ou encore les assistants vocaux locaux ne nécessitant plus de connexion Internet pour fonctionner.

À lire aussi : Empreinte carbone : le grand défi écologique de l’IA verte

Nvidia contre-attaque avec des superpuces

Face à cette tendance, les fabricants de matériel informatique s’adaptent. Nvidia, leader incontesté des puces graphiques, a annoncé le 18 mars 2025 une nouvelle génération de processeurs ultra-performants : les Blackwell Ultra GB300 et Vera Rubin. Le GB300, prévu pour le second semestre 2025, offrira 20 pétaflops de puissance (soit vingt millions de milliards d’opérations par seconde) et une mémoire de 288 Go, un bond gigantesque par rapport aux modèles actuels. La puce Vera Rubin, attendue en 2026, promet quant à elle de doubler ces performances. Pour 2027, Nvidia plancherait sur un processeur capable de gérer… 100 pétaflops, pas moins. L’objectif ? Permettre à des entreprises et chercheurs de faire tourner des IA complexes avec un nombre réduit de composants.

Le hic ? Ces superpuces seront évidemment gourmandes en énergie. La puissance thermique de calcul d’une Blackwell Ultra GB300 est annoncée à 1 400 watts. Chaud devant ! Pour gérer cette consommation accrue, Nvidia a dû repenser entièrement le système de refroidissement, passant à un refroidissement liquide complet avec des plaques de refroidissement à eau améliorées et des connecteurs à déconnexion rapide plus performants… bref, tout un nouvel écosystème très énergivore. Cette course à la puissance pose une question cruciale : faut-il encore investir dans des infrastructures massives alors que l’IA devient de plus en plus efficace ? Avec des modèles frugaux qui tiennent dans des ordinateurs personnels, Nvidia joue peut-être son va-tout en repoussant encore les limites du matériel.

Le paradoxe chinois : une IA frugale sous contrainte

Plus grand marché mondial pour les semi-conducteurs, la Chine n’a jamais réussi à s’imposer dans ce domaine. Malgré la création du fabricant national SMIC en 2000, le pays peine à concurrencer les deux leaders en matière de production, à savoir Taïwan (TSMC) et la Corée du Sud (Samsung). Néanmoins, la Chine cherche très activement à réduire sa dépendance dans ces domaines. Y compris en ce qui concerne les processeurs graphiques à destination des IA, marché largement dominé par l’américain Nvidia (dont la production est assurée majoritairement par TSMC). Des cartes qu’elles ont, de toute manière, beaucoup de mal à acquérir puisque les États-Unis ont mis en place des restrictions d’exportation des semi-conducteurs les plus puissants.

Comme solution, la Chine se barricade elle aussi… et investit massivement. Courant 2024, le pays a banni les processeurs américains Intel et AMD de ses ordinateurs gouvernementaux afin de favoriser la production locale via son plan “Made in China 2025”. Elle interdit ou limite l’exportation de matériaux nécessaires à la fabrication de puces. Gallium et germanium, par exemple, ont désormais la préférence du sol sous prétexte de “préserver la sécurité et les intérêts nationaux.” Selon des estimations de la Commission européenne, le pays fournit 94 % du gallium dans le monde et 83 % du germanium.

De plus, la Chine a annoncé en janvier 2025 un plan d’investissement de 37 milliards de dollars pour accélérer son autonomie et atteindre l’autosuffisance technologique. Dans l’intervalle, les entreprises locales doivent faire avec les moyens du bord, ne pouvant pas mettre la main sur les puces Nvidia les plus avancées. Cela donne des innovations particulièrement intéressantes comme DeepSeek et ses 32 GPU ou les déclinaisons locales autonomes.

Une révolution (aussi) pour le grand public ?

L’IA frugale ne se limite pas aux entreprises. Elle pourrait bientôt transformer l’expérience des utilisateurs grand public.

  • Des assistants IA locaux : plus besoin de connexion Internet pour utiliser un chatbot intelligent.
  • Des applications mobiles plus puissantes : des smartphones capables de traiter de l’IA en interne sans dépendance cloud.
  • Un impact écologique réduit : moins de serveurs signifie une consommation énergétique en baisse.
  • Des coûts d’accès réduits : plus besoin de payer un abonnement mensuel à un service cloud pour accéder à une IA avancée.

Avec ces avancées, l’IA pourrait sortir des centres de données et s’inviter directement sur nos ordinateurs personnels et appareils mobiles, rendant ses usages plus fluides et accessibles à tous.

L’IA frugale, une réelle alternative ?

Le futur de l’IA ne passera peut-être plus par des fermes de serveurs gigantesques, mais par des modèles optimisés capables de fonctionner en local. Une sorte de “loi de Moore” inversée et verte, en somme, comme le suggère Jacky Isabello, fondateur de Parlez-moi d’Impact. Il évoque même un projet révolutionnaire en cours chez Google : Gemma 3. Cette IA serait un modèle qui ne nécessiterait plus qu’un seul GPU pour rivaliser avec les intelligences artificielles les plus performantes. “Si les tendances se confirmaient, ce ne serait plus une simple avancée technique, mais un renversement complet du modèle économique qui régit l’IA”, explique-t-il.

Une IA frugale qui pourrait donc redéfinir la manière dont nous concevons l’intelligence artificielle et permettrait à (presque) tous les pays d’avancer sur le sujet sans avoir besoin d’y consacrer des budgets vertigineux. Jacky Isabello ajoute que “le centre de gravité de l’intelligence artificielle pourrait basculer vers un monde décentralisé, où chacun disposerait de son propre modèle, fonctionnant sur des machines locales, indépendamment des grandes plateformes.”

Loin d’être une lubie technologique, cette évolution pourrait bien rendre l’IA plus respectueuse de l’environnement et accessible à tous. Une véritable révolution est en marche, et il reste à voir quels acteurs réussiront à tirer parti de ce basculement vers une IA plus éthique, durable et performante.

SOUTENEZ WE DEMAIN, SOUTENEZ UNE RÉDACTION INDÉPENDANTE
Inscrivez-vous à notre newsletter hebdomadaire
et abonnez-vous à notre magazine.

A lire aussi :