Google s'engage à déployer 1 000 fois plus d'infrastructures d'IA au cours des 4 à 5 prochaines années - Actualité sur le financement de l'innovation

Afin de répondre à la demande massive d’IA, Google souhaite doubler la taille globale de ses serveurs tous les six mois, un taux de croissance qui permettrait de créer une capacité 1 000 fois supérieure au cours des quatre ou cinq prochaines années.

La déclaration est venue du responsable de l’infrastructure IA de Google, Amin Vahdat, lors d’une réunion à tous le 6 novembre, selon CNBC. Alphabet, la société mère de Google, affiche certainement de bons résultats, une telle exigence pourrait donc être dans les limites de ses capacités financières. Elle a publié de bons chiffres pour le troisième trimestre fin octobre et a relevé ses prévisions de dépenses en capital à 93 milliards de dollars, contre 91 milliards de dollars.

Vahdat a répondu à la question d’un employé sur l’avenir de l’entreprise, alors que l’on parlait d’une « bulle de l’IA », en réaffirmant les risques liés à un investissement peu agressif. Dans ses opérations cloud, cet investissement dans l’infrastructure s’est avéré payant. « Le risque de sous-investissement est assez élevé (…) les chiffres du cloud auraient été bien meilleurs si nous avions eu plus de calcul. »

L’activité cloud de Google continue de croître d’environ 33 % par an, créant un flux de revenus qui permet à l’entreprise d’être « mieux placée que d’autres entreprises pour résister aux échecs », a-t-il déclaré.

Avec une meilleure infrastructure exécutant un matériel plus efficace tel que l’unité de traitement Tensor de septième génération et des modèles LLM plus efficaces, Google est convaincu qu’il peut continuer à créer de la valeur pour la mise en œuvre accrue des technologies d’IA par ses utilisateurs professionnels.

Selon Markus Nispel d’Extreme Networks, écrivant sur techradar.com en septembre, c’est l’infrastructure informatique qui fait faiblir la vision de l’IA des entreprises. Il attribue l’échec des projets d’IA aux exigences élevées que les charges de travail d’IA imposent aux systèmes existants, au besoin d’installations en temps réel et en périphérie (souvent absentes des entreprises actuelles) et à la présence continue de silos de données. « Même lorsque les projets démarrent, ils sont souvent entravés par des retards causés par une mauvaise disponibilité des données ou des systèmes fragmentés. Si des données propres et en temps réel ne peuvent pas circuler librement dans l’organisation, les modèles d’IA ne peuvent pas fonctionner efficacement et les informations qu’ils produisent arrivent trop tard ou manquent d’impact », a-t-il déclaré.

« Alors que 80 % des projets d’IA peinent à répondre aux attentes à l’échelle mondiale, principalement en raison des limitations de l’infrastructure plutôt que de la technologie d’IA elle-même, ce qui compte désormais, c’est la façon dont nous y répondons. »

Son point de vue est partagé par les décideurs des grands fournisseurs de technologie : les dépenses en capital de Google, Microsoft, Amazon et Meta devraient dépasser 380 milliards de dollars cette année, dont la majorité est consacrée à l’infrastructure d’IA.

Le message des hyperscalers est clair : si nous le construisons, ils viendront.

Relever les défis d’infrastructure auxquels les organisations sont confrontées est l’élément clé d’une mise en œuvre réussie de projets basés sur l’IA. Une infrastructure agile aussi proche que possible du point de calcul et des ensembles de données unifiés sont considérés comme des éléments importants de la recette pour tirer pleinement parti des projets d’IA de nouvelle génération.

Bien qu’un certain réalignement du marché soit attendu dans le secteur de l’IA au cours des six prochains mois, des entreprises comme Google font partie de celles qui devraient être en mesure de se consolider sur le marché et de continuer à proposer des technologies révolutionnaires basées sur l’IA au fur et à mesure de son évolution.

(Source de l’image : « Chantier de construction » de tomavim est sous licence CC BY-NC 2.0.)