Viviamo nell'era dell'efficienza estrema.
I modelli linguistici che nel 2021 costavano 60 dollari per milione di token ora costano meno di 0,06 dollari, un calo di 1.000 volte in soli tre anni. Quando GPT-3 è diventato disponibile al pubblico nel novembre 2021, era l'unico modello in grado di raggiungere un MMLU di 42, addebitando quella piccola fortuna per milione di token elaborati. Oggi, Llama 3.2 3B offre le stesse prestazioni a pochi centesimi. Per non parlare dei nuovi modelli con benchmark molto migliori.
Con ogni nuova generazione di GPU Nvidia – Hopper H100, Blackwell B200 e le architetture future – i framework di inferenza si evolvono, le tecniche di quantizzazione migliorano e il costo dell'elaborazione dell'intelligenza artificiale precipita lungo una curva ancora più ripida della Legge di Moore. Stiamo parlando di un tasso di riduzione di almeno 15 volte all'anno, con alcuni benchmark che mostrano cali fino a 900 volte all'anno a seconda dell'attività.
Ma c'è un paradosso che in pochi notano: l'efficienza che guida l'adozione di IA Potrebbe essere lo stesso spillo che fa scoppiare la tua bolla finanziaria.
La trappola dell'efficienza
Le aziende che attualmente vendono inferenza, ovvero fanno pagare per l'utilizzo di modelli di intelligenza artificiale, sono intrappolate in un dilemma inevitabile: i loro costi diminuiscono di 15 volte all'anno, ma lo stesso vale per il prezzo che possono applicare. È un deflazione esponenzialenon inflazionistico.
Facciamo due conti: un data center che oggi costa 1 miliardo di dollari deve calcolare il ritorno sull'investimento in base a prezzi che saranno 15 volte inferiori l'anno prossimo e 225 volte inferiori tra due anni. È come costruire una raffineria di petrolio quando il prezzo del barile scende 15 volte all'anno: i conti semplicemente non tornano.
Chi vende token all'ingrosso e li rivende come strumenti (chatbot, copiloti, assistenti aziendali) si renderà presto conto che anche il valore percepito dall'utente finale diminuisce, con la scomparsa della barriera all'ingresso. Un prodotto che oggi richiede un'infrastruttura multimilionaria potrebbe essere replicato da una startup a un millesimo del costo originale. La democratizzazione non è solo tecnologica: È economico.
Ed ecco il punto cruciale: Quando il prezzo del tuo prodotto diventa più basso più velocemente di quanto tu riesca a creare domanda, non hai un'attività sostenibile. Sei in una corsa al ribasso.
Il paradosso degli investimenti
Mentre i costi crollano, la spesa in conto capitale (capex) globale per le infrastrutture di intelligenza artificiale, in particolare nei data center e nelle GPU, sta crescendo a un ritmo record. Migliaia di miliardi di dollari vengono investiti in server che, tra qualche anno, potrebbero essere sottoutilizzati, operando con margini negativi, come le criptovalute abbandonate nel 2018.
La logica è affascinante nella sua contraddizione: gli investitori stanno finanziando la costruzione di un'infrastruttura basata sul presupposto della scarsità ("più potenza di calcolo, più valore creiamo"), mentre la tecnologia che stanno finanziando sta dimostrando che avremo abbondanza. E l'abbondanza digitale è, per definizione, deflazionistica.
È l'equivalente di investire miliardi in centrali elettriche, mentre l'efficienza dei pannelli solari raddoppia ogni anno. A un certo punto, ci si rende conto di aver accumulato troppa capacità per un mercato che ne ha sempre meno bisogno.
Il problema non è tecnologico: stiamo vincendo su questo fronte. Il problema è economico. Le proiezioni mostrano che entro il 2029, anche nello scenario conservativo, il costo per milione di token scenderà a 0,000019 dollari. Nello scenario ottimistico? A 0,000001 dollari. Ciò significa che il fatturato per unità di elaborazione diminuirà di oltre... 3.000 volte nei prossimi cinque anni.
Come si può monetizzare qualcosa che tende a un costo marginale pari a zero?
Abbiamo già visto questo film
Nel XIX secolo il mondo fu testimone di un'euforia simile: La bolla ferroviaria.
Gli investitori investirono fortune nell'espansione delle linee ferroviarie degli Stati Uniti. Il paese si stava unendo da costa a costa e ogni metro di binario sembrava una promessa di ricchezza infinita. Le aziende furono create puramente per speculazione, molte senza nemmeno un piano operativo realistico.
Quando la bolla scoppiò nel 1873, il crollo fu brutale. Ferrovia del Pacifico settentrionale È fallita. La banca Jay Cooke & CompanyLa ferrovia, una delle più potenti d'America, crollò. Seguì una depressione economica durata cinque anni. Gli investitori persero fortune. Migliaia di compagnie ferroviarie scomparvero da un giorno all'altro.
Ma ecco il colpo di scena: Le tracce sono rimaste.
L'eredità di quella bolla fu monumentale. L'infrastruttura ferroviaria costruita durante la frenesia speculativa aprì la strada alla logistica che sostenne gli Stati Uniti per oltre un secolo. Gli agricoltori spedivano grano verso porti lontani. I prodotti manifatturieri raggiungevano l'entroterra. Le persone si spostavano tra gli stati con una facilità inimmaginabile decenni prima.
La bolla ha punito gli investitori, ma utenti premiati.
La stessa cosa accadde con la bolla delle dot-com alla fine degli anni '90. Miliardi di dollari furono spesi in startup non redditizie, modelli di business assurdi e aziende che esistevano solo in PowerPoint. Pets.com Divenne una barzelletta. Webvan è un caso di studio sul fallimento. Centinaia di aziende dot-com furono spazzate via quando la bolla scoppiò nel 2000.
Ma cosa rimane? I cavi in fibra ottica che collegano il mondo. I protocolli TCP/IP che utilizziamo ogni giorno. La cultura digitale che definisce l'economia moderna. I data center, le piattaforme di e-commerce, il cloud che custodisce le nostre vite.
Le bolle costruiscono il futuro, anche se distruggono il presente per i loro investitori.
La prossima bolla: l'intelligenza artificiale
La "bolla dell'intelligenza artificiale" è, in sostanza, una bolla di efficienza.
Aziende e governi scommettono su una crescita illimitata di utilizzo e valore, senza rendersi conto che il progresso tecnologico stesso mina i fondamentali economici che sostengono questa aspettativa. È come scommettere che l'oro aumenterà di valore mentre si inventa una macchina per trasformare il piombo in oro: meglio funziona la macchina, meno vale l'oro.
Il costo marginale dell'intelligenza si sta avvicinando allo zero. E quando il costo marginale scende a zero, il profitto segue lo stesso percorso, a meno che non si sia un monopolista e, nel mondo dei modelli open source e dell'hardware commercializzato, i monopoli sono impossibili da mantenere.
I segnali ci sono già tutti:
- Le aziende infrastrutturali competono per contratti a lungo termine a prezzi insostenibili.
- Aggregatori di valore senza potere di determinazione dei prezzi sostenibile.
- Modelli di business basati su margini che si sciolgono più velocemente del ghiaccio nel deserto.
- Valutazioni miliardarie di aziende il cui prodotto principale diventerà una commodity entro 18 mesi.
La corsa all'oro dell'intelligenza artificiale sta creando un'infrastruttura magnifica: GPU all'avanguardia, framework ottimizzati, modelli in continuo miglioramento. Ma sta anche creando un'illusione finanziaria: che questa infrastruttura genererà rendimenti proporzionali all'investimento.
Non lo genererà. Non può generarlo. La matematica non lo consente.
Conclusione: le bolle costruiscono il futuro
Le bolle sono distruttive, ma anche produttive.
Puniscono gli investitori che confondono l'euforia con l'analisi. Spazzano via le aziende che esistono solo per cavalcare l'onda. Smascherano i deboli, gli opportunisti, coloro che hanno costruito castelli di sabbia su fondamenta immaginarie.
Ma fanno anche qualcosa di straordinario: Costruiscono il futuro più velocemente di quanto potrebbe fare qualsiasi pianificazione razionale.
Nessuna commissione governativa avrebbe approvato l'investimento necessario per coprire gli Stati Uniti di binari ferroviari al ritmo del capitalismo speculativo. Nessun piano centralizzato avrebbe installato la quantità di fibra ottica installata dalle aziende della bolla delle dot-com. L'irrazionalità dei mercati si sviluppa su una scala e a una velocità che la razionalità non può raggiungere.
Proprio come la bolla ferroviaria ha aperto la strada al progresso industriale e la bolla di Internet ha gettato le basi per l'era digitale, La bolla dell'intelligenza artificiale aprirà la strada all'infrastruttura cognitiva che il mondo utilizzerà nei decenni a venire.
La bolla scoppierà, certo. Molte aziende falliranno. Molti investitori perderanno denaro. Molti data center saranno sottoutilizzati.
Ma quando la polvere si sarà depositata, ciò che rimarrà sarà un mondo in cui l'intelligenza artificiale sarà economica, onnipresente e integrata in ogni cosa. Un mondo in cui consultare un modello linguistico costerà meno di una frazione di centesimo. Un mondo in cui le piccole imprese avranno accesso alle stesse capacità cognitive attualmente disponibili solo ai giganti della tecnologia.
I binari per l'intelligenza artificiale sono già in fase di costruzione attraverso speculazioni. Il nostro compito non è investire nei binari, ma imparare a guidare i treni.
Chiamata alla riflessione
L'efficienza è una cosa positiva, finché non diventa troppo efficiente.
Quando l'intelligence non costerà nulla, chi avrà un vantaggio competitivo? Non saranno coloro che possiedono i modelli, perché saranno open source. Non saranno coloro che possiedono i data center, perché la capacità sarà abbondante e standardizzata.
Il vantaggio andrà a coloro che sapranno porre le domande giuste. A coloro che sapranno integrare l'intelligenza nei problemi reali. A coloro che costruiranno sull'infrastruttura che la bolla sta creando.
La domanda rimane: si investe nella costruzione di data center o si impara a utilizzare ciò che producono?
La risposta giusta potrebbe determinare chi sopravviverà quando la bolla scoppierà e chi prospererà quando la situazione si sarà calmata.









