Nous vivons à l'ère de l'efficacité extrême.
Les modèles de langage qui coûtaient 60 $ par million de jetons en 2021 coûtent désormais moins de 0,06 $, soit une chute de prix d'un facteur 1 000 en seulement trois ans. Lors de sa mise à disposition publique en novembre 2021, GPT-3 était le seul modèle capable d'atteindre une MMLU de 42, facturant cette somme considérable par million de jetons traités. Aujourd'hui, Llama 3.2 3B offre les mêmes performances pour une fraction du prix. Sans parler des nouveaux modèles aux performances bien supérieures.
À chaque nouvelle génération de GPU Nvidia (Hopper H100, Blackwell B200 et les architectures à venir), les frameworks d'inférence évoluent, les techniques de quantification s'améliorent et le coût du traitement de l'intelligence artificielle chute encore plus rapidement que ne le prévoit la loi de Moore. On parle d'une réduction d'au moins 15 fois par an, certains benchmarks faisant état de baisses allant jusqu'à 900 fois par an selon la tâche.
Mais il existe un paradoxe que peu de gens perçoivent : l'efficacité qui favorise l'adoption de IA Il pourrait s'agir de la même épingle qui fera éclater votre bulle financière.
Le piège de l'efficacité
Les entreprises qui vendent actuellement des services d'inférence — c'est-à-dire qui facturent l'utilisation de modèles d'IA — sont prises au piège d'un dilemme inévitable : leurs coûts diminuent 15 fois par an, mais le prix qu'elles peuvent facturer diminue également. C'est un déflation exponentiellenon inflationniste.
Faisons le calcul : un centre de données qui coûte 1 milliard de dollars aujourd’hui doit être rentabilisé en se basant sur des prix qui seront 15 fois inférieurs l’année prochaine et 225 fois inférieurs dans deux ans. C’est comme construire une raffinerie de pétrole alors que le prix du baril chute 15 fois par an : le calcul est tout simplement impossible.
Ceux qui vendent des jetons en gros pour les revendre sous forme d'outils (chatbots, copilotes, assistants d'entreprise) se rendront vite compte que la valeur perçue par l'utilisateur final diminue également, à mesure que les barrières à l'entrée disparaissent. Un produit qui nécessite aujourd'hui une infrastructure de plusieurs millions de dollars pourrait être reproduit par une start-up pour un millième de son coût initial. La démocratisation n'est pas seulement technologique ; C'est économique.
Et voici le point crucial : Lorsque le prix de votre produit baisse plus vite que vous ne pouvez créer de la demande, votre entreprise n'est plus viable. Vous êtes engagé dans une course vers le bas.
Le paradoxe de l'investissement
Alors que les coûts chutent, les dépenses d'investissement mondiales (capex) dans l'infrastructure d'IA — notamment dans les centres de données et les GPU — croissent à un rythme record. Des milliers de milliards de dollars sont investis dans des serveurs qui, d'ici quelques années, pourraient être sous-utilisés et fonctionner à perte, à l'instar des fermes de minage de cryptomonnaies abandonnées en 2018.
La logique est fascinante par sa contradiction : les investisseurs financent la construction d’une infrastructure fondée sur le postulat de la rareté (« plus de puissance de calcul, plus nous créons de valeur »), alors que la technologie qu’ils financent prouve que nous connaîtrons l’abondance. Or, l’abondance numérique est, par définition, déflationniste.
C'est comme investir des milliards dans des centrales électriques alors que le rendement des panneaux solaires double chaque année. À un moment donné, on se rend compte qu'on a construit une capacité surdimensionnée pour un marché qui en demande de moins en moins.
Le problème n'est pas technologique — nous sommes en train de gagner sur ce point. Le problème est économique. Les projections montrent que d'ici 2029, même dans le scénario le plus prudent, le coût par million de jetons tombera à 0,000019 $US. Dans le scénario le plus optimiste ? 0,000001 $US. Cela signifie que le revenu par unité de calcul diminuera de plus de… 3 000 fois au cours des cinq prochaines années.
Comment monétiser quelque chose dont le coût marginal tend vers zéro ?
On a déjà vu ce film.
Au XIXe siècle, le monde a connu une euphorie similaire : La bulle ferroviaire.
Les investisseurs ont englouti des fortunes dans l'expansion du réseau ferroviaire américain. Le pays se traçait d'un océan à l'autre, et chaque mètre de voie semblait promettre une richesse infinie. Des sociétés furent créées à des fins purement spéculatives, souvent sans même un plan d'exploitation réaliste.
Lorsque la bulle éclata en 1873, l'effondrement fut brutal. Chemin de fer du Pacifique Nord Elle a fait faillite. La banque Jay Cooke & CompagnieLe réseau ferroviaire, l'un des plus puissants d'Amérique, s'effondra. Une dépression économique de cinq ans s'ensuivit. Les investisseurs perdirent des fortunes. Des milliers de compagnies ferroviaires disparurent du jour au lendemain.
Mais voici le hic : Les traces étaient toujours là.
L'héritage de cette bulle spéculative fut colossal. L'infrastructure ferroviaire construite durant cette période de frénésie a ouvert la voie à une logistique qui a soutenu les États-Unis pendant plus d'un siècle. Les agriculteurs expédiaient leurs céréales vers des ports lointains. Les produits manufacturés parvenaient à l'intérieur des terres. Les déplacements entre États se faisaient avec une facilité inimaginable quelques décennies auparavant.
La bulle a pénalisé les investisseurs, mais utilisateurs récompensés.
La même chose s'est produite avec la bulle Internet à la fin des années 90. Des milliards ont été gaspillés dans des start-ups non rentables, des modèles commerciaux absurdes et des entreprises qui n'existaient que sur PowerPoint. Pets.com C'est devenu la risée de tous. Webvan est un cas d'école d'échec. Des centaines d'entreprises du secteur Internet ont disparu lors de l'éclatement de la bulle en 2000.
Mais que reste-t-il ? Les câbles à fibres optiques qui connectent le monde. Les protocoles TCP/IP que nous utilisons quotidiennement. La culture numérique qui définit l’économie moderne. Les centres de données, les plateformes de commerce électronique, le cloud qui stocke nos vies.
Les bulles spéculatives construisent l'avenir, même si elles détruisent le présent pour leurs investisseurs.
La prochaine bulle : l'intelligence artificielle
La « bulle de l'IA » est, en substance, une bulle d'efficacité.
Les entreprises et les gouvernements misent sur une croissance illimitée de l'usage et de la valeur, sans se rendre compte que le progrès technologique lui-même fragilise les fondements économiques qui sous-tendent cette prévision. C'est comme parier sur la prise de valeur de l'or tout en inventant une machine à transformer le plomb en or : plus la machine est performante, moins l'or vaut.
Le coût marginal de l'intelligence tend vers zéro. Et lorsque le coût marginal tend vers zéro, le profit suit la même trajectoire — sauf si vous êtes un monopole, et dans le monde des modèles open source et du matériel standardisé, les monopoles sont impossibles à maintenir.
Tous les signes sont déjà là :
- Les entreprises d'infrastructures se font concurrence pour obtenir des contrats à long terme à des prix insoutenables.
- Des agrégateurs de valeur sans pouvoir de fixation des prix durable.
- Des modèles économiques basés sur des marges qui fondent plus vite que la glace dans le désert.
- Des valorisations en milliards de dollars d'entreprises dont le produit phare deviendra un produit de base dans 18 mois.
La ruée vers l'or de l'IA crée une infrastructure magnifique : des GPU de pointe, des frameworks optimisés, des modèles en constante amélioration. Mais elle crée aussi une illusion financière : celle que cette infrastructure générera des rendements proportionnels à l'investissement.
Cela ne fonctionnera pas. C'est impossible. Les calculs mathématiques ne le permettent pas.
Conclusion : Les bulles construisent l'avenir
Les bulles sont destructives, mais aussi productives.
Ils sanctionnent les investisseurs qui confondent euphorie et analyse. Ils font disparaître les entreprises qui ne font que surfer sur la vague. Ils démasquent les faibles, les opportunistes, ceux qui ont bâti des châteaux de sable sur des fondations illusoires.
Mais ils font aussi quelque chose d'extraordinaire : Ils construisent l'avenir plus vite que ne le permettrait n'importe quelle planification rationnelle.
Aucun comité gouvernemental n'aurait approuvé les investissements nécessaires pour couvrir les États-Unis de voies ferrées au rythme où l'a fait le capitalisme spéculatif. Aucun plan centralisé n'aurait permis d'installer autant de fibre optique que les entreprises de la bulle Internet. L'irrationalité des marchés se développe à une échelle et à une vitesse que la rationalité ne peut atteindre.
De même que la bulle ferroviaire a ouvert la voie au progrès industriel et que la bulle internet a jeté les bases de l'ère numérique, La bulle de l'IA ouvrira la voie à l'infrastructure cognitive que le monde utilisera pendant des décennies à venir.
La bulle va éclater, oui. De nombreuses entreprises feront faillite. De nombreux investisseurs perdront de l'argent. De nombreux centres de données seront sous-utilisés.
Mais une fois la poussière retombée, il restera un monde où l'intelligence artificielle sera bon marché, omniprésente et intégrée à tous les aspects de notre vie. Un monde où consulter un modèle de langage coûtera moins d'un centime. Un monde où les petites entreprises auront accès aux mêmes capacités cognitives que celles actuellement réservées aux géants de la tech.
Les fondements de l'IA sont déjà posés par la spéculation. Notre tâche n'est pas d'investir dans ces fondements, mais d'apprendre à conduire les trains.
Appel à la réflexion
L'efficacité est une bonne chose — jusqu'à ce qu'elle devienne excessive.
Quand l'intelligence sera gratuite, qui aura un avantage concurrentiel ? Ce ne seront pas ceux qui possèdent les modèles, car ils seront en accès libre. Ce ne seront pas ceux qui possèdent les centres de données, car la capacité sera abondante et standardisée.
L'avantage ira à ceux qui sauront poser les bonnes questions, à ceux qui sauront intégrer l'intelligence aux problèmes concrets, et à ceux qui sauront bâtir sur l'infrastructure que crée cette bulle.
La question demeure : investissez-vous dans la construction de centres de données ou dans l’apprentissage de l’utilisation des données qu’ils produisent ?
La bonne réponse pourrait déterminer qui survivra à l'éclatement de la bulle — et qui prospérera une fois la poussière retombée.









