Aller au contenu principal

Liang Wenfeng (DeepSeek) : 5 leçons de frugalité technologique qui font trembler la Silicon Valley

Le 27 janvier 2025, un hedge fund chinois fait perdre 593 milliards de dollars à Nvidia en une journée. 5 principes opératoires tirés de la méthode Liang Wenfeng pour les dirigeants français en 2026.

Le 27 janvier 2025, en l’espace d’une séance boursière, Nvidia perd cinq cent quatre-vingt-treize milliards de dollars de capitalisation. La cause n’est ni une annonce de la Fed, ni une crise géopolitique, ni un défaut d’un grand client. C’est un papier de recherche de quarante-six pages, publié par une équipe chinoise inconnue du grand public, et son code source posté en open-source sous licence MIT. Le modèle s’appelle DeepSeek-R1. Il atteint les performances de GPT-4o et d’o1 d’OpenAI sur les benchmarks de raisonnement. Et son coût d’entraînement annoncé — 5,6 millions de dollars de compute, selon le papier DeepSeek-V3 Technical Report publié en décembre 2024 sur arXiv et discuté dans Nature — représente environ 5 % de ce qu’OpenAI dépense pour un modèle équivalent. L’auteur de ce séisme s’appelle Liang Wenfeng, il a quarante ans, il est diplômé d’ingénierie informatique de l’université du Zhejiang, et il a dirigé pendant huit ans un hedge fund quantitatif appelé High-Flyer Capital avant de basculer son surplus de GPU vers la recherche en intelligence artificielle.

L’épisode DeepSeek a été analysé sous tous les angles par le Financial Times, le MIT Technology Review, Wired, SemiAnalysis et l’essayiste Ben Thompson dans Stratechery (numéro du 27 janvier 2025). La conclusion commune de ces analyses est la suivante : DeepSeek n’a pas seulement produit un modèle moins cher — il a invalidé l’hypothèse stratégique implicite sur laquelle reposaient les valorisations de la Silicon Valley, à savoir que la performance des LLM serait une fonction monotone du capital investi. Liang Wenfeng a démontré qu’avec une équipe d’environ cent quarante personnes, dont la moitié de jeunes diplômés sans CV stellaire, et une discipline d’optimisation au niveau du substrat (kernels CUDA réécrits, architecture Mixture-of-Experts radicalement parcimonieuse), on pouvait obtenir des résultats que l’industrie supposait réservés à des dépenses cent fois supérieures. Pour le dirigeant français de PME qui pense que « l’IA, c’est pour les GAFAM », et qui repousse depuis trois ans tout projet sérieux d’automation au prétexte du coût, la grille Liang Wenfeng est un rappel direct : la frugalité méthodique bat l’opulence indisciplinée.


La méthode — 5 principes de la frugalité Liang Wenfeng

Étape 1 — Refuser le dogme « plus de capex = plus de performance »

Le pari de la Silicon Valley depuis 2020 était simple : qui empile le plus de GPU gagne. Sam Altman a fait campagne pour mobiliser 7 000 milliards de dollars d’investissement compute. Mark Zuckerberg a annoncé l’achat de 350 000 H100. Liang Wenfeng a fait exactement l’inverse : il s’est demandé combien il pouvait économiser à chaque couche d’architecture. Résultat documenté dans Nature et MIT Tech Review : un modèle aux performances comparables, avec un coût d’inference divisé par dix à vingt. Le dogme n’a pas seulement été remis en cause — il a été démonétisé en bourse.

Transposition business : la plupart des dirigeants de PME reproduisent ce dogme à leur échelle. Un nouveau CRM, un nouveau site, une nouvelle équipe — la solution par défaut est « investir plus ». Avant d’investir plus, avez-vous épuisé ce que l’investissement actuel peut produire si vous le pilotez avec rigueur ? Dans 70 % des cas que j’observe, la réponse est non. L’organisation a déjà payé pour des outils sous-exploités, pour des compétences sous-utilisées, pour un pipeline qui n’est pas travaillé jusqu’au bout. Liang Wenfeng aurait commencé là.

Action concrète : Avant tout nouvel investissement supérieur à 10 K€, listez les trois actifs que vous possédez déjà et qui sont exploités à moins de 60 %. Définissez ce qu’il faudrait pour les amener à 90 %. Si le gain potentiel dépasse l’investissement envisagé, reportez l’investissement de six mois et travaillez les actifs existants d’abord.


Étape 2 — Utiliser l’open-source comme arme stratégique

Liang Wenfeng n’a pas vendu DeepSeek-R1. Il l’a donné. Code, poids du modèle, technique d’entraînement, papier scientifique — tout est public, sous licence MIT, accessible gratuitement à tout développeur sur la planète. Cette générosité apparente est en réalité une attaque chirurgicale, théorisée par l’analyste Ben Thompson sous le nom de commoditize the complement : en transformant le modèle de fondation en commodité gratuite, DeepSeek détruit la valeur capturable par OpenAI et Anthropic, et laisse la valeur se réfugier vers d’autres couches — dont l’application, où la Chine est déjà dense. C’est exactement la stratégie qu’avait employée Google en publiant Android en open-source pour neutraliser iOS, ou IBM en finançant Linux pour démonétiser Microsoft.

Transposition business : combien de PME françaises gardent jalousement un savoir-faire qui, mis en open-source (formations gratuites, méthodes publiées, outils donnés), démonétiserait leurs concurrents directs et reconcentrerait la valeur sur leur propre couche d’expertise rare ? La logique n’est ni naïve ni philanthropique : donner ce qui peut être copié protège ce qui ne peut pas l’être. Le contenu libéré devient un canal d’acquisition, une preuve d’autorité, un standard sectoriel — pendant que la valeur réelle (l’accompagnement, la mise en œuvre, le sur-mesure) reste protégée. Cette logique est développée pour le positionnement expert dans Content marketing : la position d’expert comme actif rare.

Action concrète : Identifiez une méthode, un outil ou une grille que vous gardez confidentiel par habitude. Publiez-en une version utilisable gratuitement sous trente jours. Mesurez l’effet sur vos demandes entrantes au trimestre suivant. Dans 80 % des cas, vous découvrirez que la rétention vous coûtait plus qu’elle ne vous protégeait.


Étape 3 — Préférer les jeunes talents affamés aux stars de CV

L’équipe DeepSeek compte environ cent quarante personnes selon SemiAnalysis, dont une part importante de jeunes ingénieurs sortis directement d’universités chinoises de second rang. Liang Wenfeng a explicitement refusé la stratégie OpenAI consistant à débaucher à coup de millions des chercheurs senior. Son raisonnement, documenté dans une interview à 36Kr en juillet 2024 : les chercheurs établis transportent avec eux les hypothèses dominantes ; les jeunes affamés en sont libres et acceptent de remettre en cause l’évidence. Coût salarial divisé par cinq, vitesse d’expérimentation multipliée par trois, et — paradoxalement — résultats supérieurs sur le terrain de l’optimisation radicale.

Transposition business : la PME française a une obsession du CV qui coûte cher et produit peu. Le recrutement par CV traque les profils déjà éprouvés ailleurs, donc déjà chers, donc déjà installés dans des routines. Liang Wenfeng inverse la logique : recruter des profils sous-évalués par le marché, qui n’ont pas encore eu l’occasion de prouver, mais qui veulent prouver. La discipline du recrutement par CV, prolongement de Sparte : sélection d’élite pour recruter une équipe commerciale, passe par la mise à l’épreuve plutôt que par l’examen du passé.

Action concrète : Sur votre prochain recrutement, ouvrez 30 % des candidatures à des profils sans le CV attendu. Sélectionnez sur un test pratique réalisé en conditions réelles plutôt que sur l’entretien narratif. Le risque d’erreur est légèrement supérieur ; le potentiel de découverte est considérablement plus élevé.


Étape 4 — Optimiser au niveau du substrat, pas seulement de l’interface

La performance DeepSeek-V3 ne vient pas d’une architecture théorique exotique : elle vient d’une obsession millimétrique de l’optimisation à chaque couche. Les ingénieurs de DeepSeek ont réécrit en assembleur certains kernels CUDA que les équipes occidentales utilisaient en versions standard fournies par Nvidia. Ils ont compressé les communications inter-GPU au niveau du bit. Ils ont conçu une architecture Mixture-of-Experts qui n’active que 37 milliards de paramètres sur 671 milliards à chaque token, divisant par dix-huit le coût d’inférence. SemiAnalysis a calculé que ces optimisations cumulent un facteur de gain d’environ vingt à trente sur le coût total. L’innovation est dans la profondeur, pas dans la hauteur.

Transposition business : la plupart des PME cherchent leurs gains de productivité dans la couche visible — un nouveau logiciel, un nouveau process, une nouvelle équipe. Le vrai gisement est presque toujours au niveau du substrat : la lenteur d’un transfert d’information entre deux services, la duplication de saisie, le temps perdu en réunions de coordination, la non-fluidité du parcours client. Une heure gagnée sur un substrat parcouru cent fois par jour vaut mille fois la même heure gagnée sur une décision exceptionnelle.

Action concrète : Identifiez le « kernel » de votre activité — l’action que votre équipe répète plusieurs dizaines de fois par jour (saisie commande, qualification lead, devis, support). Chronométrez la version actuelle, identifiez deux frictions, supprimez-les. Le gain cumulé dépasse presque toujours celui d’un grand projet de transformation.


Étape 5 — Ne pas demander la permission de jouer

DeepSeek a été financé sans investisseur extérieur, sans fonds souverain, sans levée annoncée — Liang Wenfeng a autofinancé l’aventure par les bénéfices de High-Flyer. Cette indépendance financière a une conséquence stratégique majeure : aucun board à convaincre, aucun pitch à formater, aucun comité d’investissement à rassurer. Pendant que les startups américaines passaient un trimestre à lever leur tour Series C, DeepSeek itérait. Caixin et FT documentent que cette indépendance est partagée par plusieurs des nouveaux acteurs chinois (BYD à ses débuts, ByteDance avant son introduction). La permission d’agir ne se demande pas à un capital qu’on n’a pas pris.

Transposition business : le dirigeant de PME française attend souvent des conditions qu’il n’aura jamais — financement parfait, marché mûr, équipe complète. Liang Wenfeng n’a pas attendu : il a fait avec ce qu’il avait, l’a fait sérieusement, l’a fait vite. Cette discipline de l’action sans permission rejoint ce qu’on développe dans L’action prime la perfection : la maladie du dirigeant qui attend trop. La permission qu’on attend masque souvent la peur qu’on ne reconnaît pas.

Action concrète : Identifiez le projet stratégique que vous reportez depuis plus de six mois faute de « conditions parfaites ». Listez ce que vous pouvez lancer dans les 30 jours avec les ressources actuelles. Lancez la version 0.5 ; itérez. Les conditions parfaites n’arriveront jamais — la pratique seule rapproche des conditions suffisantes.


Points de vigilance

Les chiffres DeepSeek ont été contestés. Plusieurs analystes (notamment SemiAnalysis) ont publié des estimations alternatives suggérant que le coût total — incluant les recherches préalables, les GPU déjà amortis sur d’autres usages, les itérations échouées — serait plus proche de 1,3 milliard de dollars que des 5,6 millions affichés. Cette correction ne change rien à la leçon stratégique : même à 1,3 milliard, le coût reste cinq à dix fois inférieur à celui des équivalents américains. La frugalité reste réelle ; elle est simplement moins miraculeuse.

L’open-source comme arme stratégique suppose un capital de réputation préalable. Liang Wenfeng pouvait libérer DeepSeek-R1 parce que High-Flyer générait déjà les revenus permettant de financer la suite. Une PME qui libère son savoir-faire sans pouvoir capter la valeur résiduelle ailleurs s’expose à un effondrement. La logique fonctionne conditionnellement à une couche de valeur protégée par ailleurs.

La frugalité Liang Wenfeng s’appuie sur des optimisations techniques que tout le monde ne sait pas reproduire. Réécrire des kernels CUDA suppose une compétence rare. La transposition pour un dirigeant de PME ne consiste pas à imiter techniquement, mais à appliquer la discipline de profondeur à son propre métier.

DeepSeek opère dans un cadre géopolitique singulier. Les restrictions américaines sur les GPU avancés ont paradoxalement accéléré l’optimisation chinoise. La contrainte a produit la créativité — leçon générale, mais condition particulière qu’on ne reproduit pas par choix.


Ce que j’en retiens

Liang Wenfeng n’a pas inventé une nouvelle science. Il a appliqué cinq disciplines que la Silicon Valley connaissait théoriquement et avait cessé d’appliquer parce qu’elle pouvait se le permettre : remettre en cause le dogme du capex, libérer ce qui peut être copié, recruter des affamés plutôt que des installés, optimiser le substrat plutôt que l’interface, et agir sans demander la permission. L’opulence finit toujours par diluer la discipline. La frugalité méthodique finit toujours par produire une accélération que les acteurs riches ne peuvent pas suivre.

Pour le dirigeant français de PME en 2026, la leçon est inconfortable. Nous avons pris l’habitude de penser que la richesse de notre écosystème (formations, réseaux, financements publics, conseils gratuits) est un avantage. Liang Wenfeng démontre l’inverse : l’abondance produit de la dispersion, la contrainte produit de la concentration. Nous ne sommes pas dépassés parce que nous manquons de moyens — nous sommes dépassés parce que nous en avons trop pour être disciplinés. L’épisode DeepSeek ne nous demande pas d’imiter la Chine ; il nous demande de retrouver l’exigence que nous avions oubliée parce qu’elle ne semblait plus nécessaire.


Sources

  • DeepSeek-V3 Technical Report, arXiv:2412.19437, décembre 2024.
  • Nature, « Chinese AI model challenges Silicon Valley assumptions », janvier 2025.
  • Financial Times, série DeepSeek janvier-mars 2025.
  • MIT Technology Review, « How DeepSeek rewrote the rules of AI economics », février 2025.
  • Stratechery (Ben Thompson), « DeepSeek FAQ », 27 janvier 2025.
  • SemiAnalysis, « DeepSeek Debates: Chinese Leadership On Cost, True Training Cost », janvier 2025.
  • Wired, profil Liang Wenfeng, février 2025.
  • 36Kr, interview Liang Wenfeng, juillet 2024 (traduction anglaise China Talk).
  • Caixin Global, suivi DeepSeek 2024-2025.

1. Quel dogme stratégique DeepSeek a-t-il invalidé en janvier 2025 ?

Bonne réponse : b). DeepSeek a démontré qu'on pouvait atteindre des performances comparables à OpenAI pour 5 à 10 fois moins cher. Nvidia a perdu 593 G$ de capitalisation en une journée. Transposé : avant d'investir plus, vérifier l'exploitation des actifs déjà payés.

2. Pourquoi publier DeepSeek-R1 en open-source MIT est-il une arme stratégique ?

Bonne réponse : b). Même stratégie que Google avec Android vs iOS, ou IBM avec Linux vs Microsoft. Transposé : donner ce qui peut être copié protège ce qui ne peut pas l'être. La rétention coûte souvent plus qu'elle ne protège.

3. Pourquoi Liang Wenfeng préfère-t-il des jeunes diplômés sans CV stellaire à des chercheurs senior ?

Bonne réponse : b). Interview Liang Wenfeng à 36Kr (2024). Transposé : ouvrir 30 % des recrutements à des profils sans le CV attendu, sélectionner sur test pratique plutôt qu'entretien narratif.

4. Où se trouve principalement le gain de productivité dans la méthode Liang Wenfeng ?

Bonne réponse : b). Innovation dans la profondeur, pas dans la hauteur. Transposé : 1 heure gagnée sur une action répétée 100 fois/jour vaut 1000 fois la même heure gagnée sur une décision exceptionnelle.

5. Quelle leçon DeepSeek donne-t-il à un dirigeant français de PME en 2026 ?

Bonne réponse : b). Nous ne sommes pas dépassés par manque de moyens — souvent l'inverse. La richesse de l'écosystème (financements publics, conseils, formations) dilue la discipline. La leçon est de retrouver l'exigence qu'on avait avant de pouvoir s'en passer.
Tags : digital-iachinedeepseekliang wenfengfrugalitéopen-sourcedirigeantpme
Damien Margarit

Formateur & consultant en stratégie commerciale, management et leadership. 15 ans en fonctions commerciales, 1 700+ personnes accompagnées. Direction Commerciale Externalisée pour TPE 150 K€–3 M€.

Cet article vous a aidé ? Partagez-le.
Audit 30 min · Offert · Sans engagement

Ce sujet résonne avec
votre quotidien ?

30 minutes en visio. Vous me dites où vous en êtes. Je vous dis si je peux vous aider — et quel format de mission DCE est le plus adapté. Vous repartez avec 3 pistes concrètes, même si on ne travaille pas ensemble.

Réponse sous 24h Sans engagement Paris & visio