Rejoignez-nous !

AJ #001 La folie DeepSeek est-elle justifiée ?

comprendre la stratégie coût développement ia deepseek r1 impact marché ia innovation intelligence artificielle modèle open source Feb 12, 2025
DeepSeek R1 est le modèle d'intelligence artificielle développé par la start-up chinoise Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.
Depuis son lancement, le 20 janvier 2025, il n'est pas excessif de dire que DeepSeek a eu une résonance mondiale.
 
La structures des coûts de développement d'une IA générative peut être schématisée en 3 dimensions:
- R&D et réalisation du modèle fondation
- Achat des données d'entraînement et processus d'entraînement per sé.
- Infrastructure technique des serveurs et mise en service pour un accès grand public
 
L'argument qui revient constamment, c'est que les résultats de Deepseek sont très bons, mais qu'ils ont été obtenus pour des investissements bien moindre que les modèles dominants actuels comme Chat GPT, Gemini ou Claude.
  
Cela se confirme-t-il à l'usage après 2 semaines d'utilisation ?

Tout d'abord, concernant les coûts de développement. Ils sont estimés, sur la base des informations communiquées par DeepSeek, à environ 6 millions de dollars. A titre de comparaison, le développement de Chat GPT 4 est estimé à environ 100 millions de dollars.

Ces données sont confidentielles, et les estimations sont basées sur les informations fournies par les entreprises. La fiabilité en reste discutable.

Sur le plan de l'entraînement, le modèle DeepSeek R1 a été entraîné en utilisant environ 2 048 puces Nvidia H800 sur une période de 55 jours, pour un coût total estimé à 5,6 millions de dollars.

Concernant les coûts d'accès aux serveurs pour les utilisateurs, DeepSeek propose des services API à des tarifs fous. Le pricing est le suivant: 0,14 $ par million de tokens en entrée (cache hit), 0,55 $ par million de tokens en entrée (cache miss) et 2,19 $ par million de tokens en sortie.

En comparaison avec ses concurrents, DeepSeek présente plusieurs avantages.

Tout d'abord les coûts de développement et l'énergie employée sont très réduits. Toujours selon DeepSeek, bien entendu, mais si c'est vrai cela représente juste une fraction du coût des concurrents occidentaux, rendant en cela l'IA plus accessible. C'est presque une forme de démocratisation, ce qui est baroque venant d'un produit chinois, mais ce qui ouvre une perspective incroyable: est-il possible de disposer d'IA Gen frugales ?

Ensuite, DeepSeek est Open source. R1 est publié sous licence MIT, permettant une utilisation libre et une collaboration ouverte au sein de la communauté.

Enfin, en terme d'efficacité, le modèle atteint des performances assez comparables aux leaders du marché, démontrant une utilisation efficace des ressources, si là encore les coûts de développement annoncés sont réels.

Mais ces avantages ne doivent pas cacher plusieurs limites.

Tout d'abord, il est amusant d'aborder des sujets politiques avec Deepseek, car le modèle peut montrer des limitations ou des biais lorsqu'il est confronté à des sujets politiquement sensibles, en raison de restrictions ou de censures potentielles. L'ombre de l'Etat chinois est omniprésente.

Sur le plan des réponses aux prompts, je trouve DeepSeek assez "rigide", avec des réponses souvent généralistes même pour des requêtes très spécifiques. L'accès aux serveurs bug régulièrement rendant l'IA souvent indisponible, mais cela s'améliore. Enfin, sur le plan des services, on est encore loin de Chat GPT.

Techniquement, il y a une ambiguïté sur la dépendance aux puces Nvidia. Cet argument est constamment avancé par les Etats-Unis, mais Huawei semble avoir énormément progressé. Où en sommes-nous vraiment ? Cette ambiguïté est perturbante.

Enfin, et l'enjeu principal est là: quel est le rôle réel de l'État chinois dans le développement de DeepSeek ? Cette question va sérieusement nous occuper dans les prochains mois.

Quoi qu'il en soit, le lancement de DeepSeek a eu des effets considérables.

Tout d'abord, l'impact sur le marché des IA générative est total. Le lancement de DeepSeek R1 a provoqué une onde de choc entraînant le 27 janvier 2025 une chute de l'action de Nvidia a chuté de près de 17 %, entraînant une perte de capitalisation boursière d'environ 589 milliards de dollars.

Il faut aussi souligner que l'adoption a été fulgurante. L'application DeepSeek AI est rapidement devenue l'application la plus téléchargée sur l'App Store d'Apple, surpassant ChatGPT, ce qui n'est pas anecdotique. Dans les 2 semaines qui ont suivi son lancement, DeepSeek a été téléchargé près de 6 millions de fois à l'échelle mondiale. 

Enfin, sur le plan stratégique, l'arrivée de DeepSeek est surprenante. En effet, face aux restrictions à l'exportation de puces avancées, DeepSeek a adopté une approche innovante en optimisant l'utilisation de ressources limitées, démontrant ainsi la capacité d'innovation sous contrainte.


J'ai conscience du volume d'information, alors je vous propose de tirer de tous ces éléments 3 enseignements majeurs:
 
1- Nous sommes dans une phase d'euphorie et de foisonnance. Un grand nombre de services basés sur l'IA générative émergent des 4 coins de la planète. Certains sont des clones de services existants, d'autres offrent des alternatives crédibles, d'autres sont totalement déficients mais en phase d'apprentissage. Cette démultiplication est normale lors de l'émergence d'une nouvelle technologie. Tous ces services ne seront pas potentiellement rentables, et cette phase sera suivie par une phase de cristallisation, où certains modèles vont s'imposer, et la plupart mourront. A cette étape, s'imposeront au maximum 3 à 5 services dominants, formant en cela un oligopole. Espérons qu'il y aura une offre européenne dans le lot.
 
2. Merci Donald !  DeepSeek utilise des puces Huawei. Bien que le modèle DeepSeek R1 ait été initialement entraîné sur des puces Nvidia H800, il exécute actuellement ses inférences sur les puces Ascend 910C de Huawei. Cette transition vers les puces Huawei permet à DeepSeek de réduire sa dépendance aux technologies américaines et de bénéficier de solutions matérielles locales. Et si Huawei peut aujourd'hui produire des puces de ce type, c'est parce que Donald Trump a interdit Huawei aux États-Unis en mai 2019 en plaçant l’entreprise sur une liste noire commerciale (Entity List) via un décret exécutif et une décision du département du Commerce. Cette interdiction empêchait les entreprises américaines de vendre des technologies et composants à Huawei sans licence spéciale, invoquant des risques de sécurité nationale liés à la 5G et aux relations de l’entreprise avec le gouvernement chinois. Huawei bénéficie d'un marché domestique gigantesque. Développer ses propres puces devient donc rentable en cas de contrainte. On peut donc dire que Trump a créé la concurrence de géants américains.
 
3. Plusieurs sources fiables, et de manière de plus en plus concordantes, affirment que DeepSeek est endogènement lié à l'Etat Chinois. Alors oui, cela parait évident, mais en le prouvant c'est mieux. Voici un article qui synthètise plusieurs points: https://urlr.me/Ma63YJ
Cette question était déjà au centre des préoccupations au sujet de WeChat. WeChat, la super app de Tencent a été propulsée par Tencent grâce à l'accès aux données fournies par l'Etat chinois. Il faut concevoir l'Etat chinois comme une structure multidivisionnelle. Chaque entreprise est juste une activité.
 
L'arrivée de Deepseek est un bouleversement, l'une des nombreuses étapes de la prolifération actuelle d'une technologie devenue grand public le 30 novembre 2022. La foisonnance que nous vivons actuellement est excitante mais elle soulève aussi des questions fondamentales sur l’impact des différentes intelligence artificielle dans nos vies, dans la santé, l'éducation ou la production industrielle. Entre innovations spectaculaires, annonces retentissantes et inquiétudes légitimes, nous assistons à une mutation accélérée des usages, où chaque avancée redéfinit les contours du possible.

Si cet article vous plait, partagez-le:

Après la lecture de cet article, je peux vous aider de plusieurs manières:

  1. Vous trouverez sans aucun doute d'autres articles à votre goût !

  2. Allez découvrir les formations. Vous en trouverez certainement une qui vous aidera dans vos activités.

  3. Rendez-vous sur la page "conférences" et voyez si cela vous inspire

  4. Allez jeter un œil à mes solutions de coaching 1:1 et mes workshops, cela vous sera peut-être utile.

 

Rejoignez Secret Sauce: la newsletter tactique ! 

Chaque samedi matin, un ensemble de techniques, astuces et tactiques qui vous permettront d'accélérer votre activité !

 

Vous ne serez pas spammé. Jamais. Promis.