Les perturbations du marché et les ondes de choc à travers la Silicon Valley ont marqué le lancement de la startup chinoise Deepseek, ce qui remet en question certaines des hypothèses fondamentales de la façon dont les sociétés d’intelligence artificielle avaient opéré et mis à l’échelle.
En moins de quelques années, le nouveau venu basé à Pékin a accompli ce que beaucoup pensaient impossible: créer des modèles d’IA qui rivalisent avec les géants de l’industrie tout en ne dépensant qu’une fraction des modèles d’enseignement des budgets de leurs concurrents et en déduisant les réponses.
L’impact au moment du lancement du public a été immédiat et mesurable. Selon le South China Morning Post, les principaux actions technologiques, notamment Nvidia, Microsoft et Meta, ont connu des baisses importantes alors que les investisseurs se sont affrontés avec les implications de l’existence de Deepseek.
La demande d’assistant IA gratuite de la startup pour iOS et Android, lancée le 10 janvier, a rapidement grimpé au premier rang de l’App Store d’Apple, déplacé le chatppt d’Openai et marquant un premier historique pour un produit d’IA chinois sur le marché américain.
Ce qui rend cela particulièrement important, c’est l’approche technologique de Deepseek. Le pont algorithmique rapporte que la société a mis en œuvre plusieurs solutions innovantes, notamment l’attention latente multi-têtes (MLA) pour réduire les goulots d’étranglement de la mémoire et l’optimisation relative des politiques de groupe (GRPO) pour rationaliser l’apprentissage du renforcement.
Les avancées permettent à Deepseek d’obtenir des résultats comparables ou supérieurs aux concurrents américains tout en utilisant beaucoup moins de ressources. L’efficacité des ressources de l’entreprise est frappante: Deepseek fonctionne avec moins de 100 000 GPU H100, tandis que Meta déploiera 1,3 million de GPU d’ici la fin 2025.
L’efficacité s’étend au-delà du matériel. Le pont algorithmique suggère que l’approche de Deepseek représente une amélioration dix fois de l’utilisation des ressources lorsque l’on considère des facteurs tels que le temps de développement et les coûts d’infrastructure.
Cependant, l’augmentation rapide de la conscience des utilisateurs occidentaux n’était pas sans défis. Le Post du matin du sud de la Chine ont rapporté que la popularité soudaine de Deepseek a entraîné un stress d’infrastructure important, ce qui a entraîné des accidents de serveurs et des préoccupations de cybersécurité qui ont forcé les limites d’enregistrement temporaire. Les douleurs croissantes mettent en évidence les défis du monde réel de la mise à l’échelle des services d’IA, quelle que soit l’efficacité architecturale.
L’engagement de l’entreprise envers le développement open source et la transparence de la recherche contraste fortement les approches secrètes des grandes entreprises technologiques américaines. Pour de nombreux observateurs de l’industrie, l’IA ouverte et hébergée localement peut être le plan de déploiement préféré.
La société a gagné des éloges de personnalités importantes de l’industrie de la technologie, notamment le capital-risqueur Marc Andreessen, qui a décrit les développements de Deepseek comme «l’une des percées les plus étonnantes et les plus impressionnantes».
Les implications politiques des événements sont importantes. Le président américain Donald Trump a qualifié l’émergence de Deepseek comme un «réveil» à l’industrie américaine, reflétant des préoccupations plus larges concernant la concurrence technologique entre les États-Unis et la Chine. Il continue de lutter contre la concurrence chinoise dans la technologie, imposant des tarifs restrictifs qui ont affecté tous les coins du globe.
Cependant, la situation transcende la simple rivalité nationale, représentant un défi fondamental à la réflexion établie sur le développement de l’IA.
Pour l’avenir, plusieurs questions clés demeurent. L’approche efficace de Deepseek peut-elle répondre à la demande croissante? Les joueurs établis ont-ils adapté leurs stratégies dans une réponse efficace? La société chinoise a démontré que l’efficacité algorithmique et la collaboration ouverte peuvent remplacer la puissance de calcul brute et le secret en tant que principaux moteurs de l’avancement de l’IA.
La perturbation du marché de l’IA peut finalement profiter à l’ensemble du domaine en forçant une réévaluation des pratiques établies et pourrait potentiellement conduire à des méthodes de développement d’IA plus efficaces et accessibles.
Bien que les réalisations de Deepseek soient remarquables depuis que nous entravez la conscience du public, il est important de noter que les grandes entreprises technologiques américaines ont publié leurs propres avancées et que la volatilité du marché dans le secteur technologique reste élevée.
Ce qui est clair, c’est que Deepseek a introduit une alternative viable à l’approche à forte intensité de capital qui a dominé le développement de l’IA. Il reste à voir que cela devient la nouvelle norme de l’industrie ou l’une des nombreuses stratégies réussies, mais l’impact de l’entreprise sur l’industrie est déjà significatif.
Photo de Markus Spiske)