Siamo nel bel mezzo della grande euforia legata alla diffusione dell’AI Generativa (GenAI) dopo il lancio di ChatGPT circa un anno e mezzo fa. Molte analisi e scenari sono stati valutati e sono state anche prospettate le opportunità e i rischi dell’impatto che le tecnologie di Intelligenza Artificiale (AI) avranno sulle aziende, sulla vita degli individui, sulla trasformazione di quasi tutti i settori economici e anche sul funzionamento dei sistemi politici e del consenso. Con l’AI siamo forse di fronte all’inizio dell’era post digital in cui una nuova forma del digitale si diffonde e pervade sia i comportamenti degli individui e dei clienti e i modelli di funzionamento delle aziende sia la modalità di interagire, creare e fruire contenuti e servizi da parte dei clienti/utenti.
Molto meno viene analizzato delle componenti infrastrutturali, tecnologiche e fisiche, che rendono possibile l’accesso, l’utilizzo e la diffusione delle tecnologie di AI. Partiamo dalle infrastrutture: i grandi modelli di linguaggio (LLM) alla base delle GenAI girano sulle infrastrutture tecnologiche che rendono disponibili i servizi Cloud, che a loro volta per funzionare, necessitano di sempre più grandi data center fisici, stracolmi di server, di chilometri di fibra e di cavi, che consumano energia elettrica e “producono” connessione e potenza computazionale. Questi data center stanno diventando delle fortezze invalicabili, protette giorno e notte e, allo stesso tempo, stanno proliferando, tanto che si prevedono 15 miliardi di investimento solo in Italia entro i prossimi due anni. Queste infrastrutture fisiche stanno progressivamente diventando fondamentali come le autostrade, la rete elettrica, le ferrovie, ma, contemporaneamente, sono poco “visibili” agli utilizzatori perché nascoste dietro “la nuvola”. In realtà, esse occupano spazio, suolo e necessitano di energia elettrica e sistemi di sicurezza per funzionare. I grandi cloud provider, che sono di fatto anche i grandi giocatori del mercato della GenAI, stanno allargando la potenza e le dimensioni dei loro data center per poter mettere a disposizione le tecnologie e i servizi di AI. L’IEA (International Energy Agency) stima che nel 2022 i data center nel mondo, incluso l’utilizzo di AI, hanno consumato 460 TWh di elettricità, il che vale circa il 2% dei consumi totali di elettricità. L’IEA prevede che entro il 2026 la domanda cresca esponenzialmente arrivando a consumare tra i 620-1050 TWh. Questo incremento corrisponderebbe approssimativamente all’aggiunta del consumo energetico di nazioni almeno come la Svezia o la Germania. L’IEA prevede, inoltre, che il trend di mercato di incorporare funzionalità di AI nel software per i diversi settori, farà ulteriormente crescere la domanda di elettricità. Di quanto questa possa crescere è difficile da prevedere. Se ad esempio si confronta la richiesta media di elettricità di una ricerca su Google (0,3 Wh) a una di ChatGPT (2,9 Wh) e considerando che si fanno circa 9 Miliardi di ricerche al giorno, questo richiederebbe quasi 10 TWh di elettricità addizionale in un anno. Il consumo di elettricità necessario per alimentare l’AI può essere meglio stimato se si prendono in considerazione i server dedicati all’AI che si prevede saranno venduti in futuro. Sappiamo che il mercato dei server AI è dominato da quelli basati sulle GPU di Nvidia con circa il 95% del mercato. Nel 2023 Nvida ha consegnato 100.000 unità che consumano una media di 7,3 TWh all’anno di elettricità. Entro il 2026 l’industria dell’AI crescerà esponenzialmente di almeno dieci volte rispetto al 2023. I data center attuali non sono organizzati e strutturati per supportare le applicazioni di AI. Ad esempio, per le infrastrutture tecnologiche dell’AI occorre una densità molto maggiore degli attuali 10 KW/rack che può arrivare a 300KW/rack. Alcuni analisti stimano che, nei prossimi 15 anni, l’80% della potenza sarà consumata nei data center dalle applicazioni di AI. Questo comporta che la domanda di nuovi data center aumenterà significativamente, il che richiederà anche nuove modalità e tecnologie per il raffreddamento e l’utilizzo di fonti alternative di produzione di elettricità da tecnologie rinnovabili, tra cui anche il nucleare tramite l’utilizzo delle nuove tecnologie dei piccoli reattori modulari e a fusione.
Anche l’utilizzo di LLM, come chatGPT, si prevede possa crescere. D’altra parte ci si attende che verranno utilizzati LLM più piccoli, specializzati,meno costosi e meno energivori grazie alla nascita di LLM aziendali più decentralizzati. Un ulteriore aspetto importante è che le attività di AI generativa si basano sull’utilizzo di modelli LLM molto sofisticati e che hanno un processo di sviluppo radicalmente diverso dagli sviluppi di programmi tradizionali. Questi modelli sono creati sostanzialmente in due fasi: una fase di addestramento off-line e una di utilizzo on-line. Entrambe sono svolte con il lavoro di potenti data center e la prima anche di un significativo lavoro manuale (a volte anche poco pagato in paesi emergenti) con tempi che possono essere diversi mesi. Inoltre, si prevede un progressivo degrado e una scarsità di free text data disponibili su internet di qualità sufficiente al training di modelli complessi già entro il 2026 e l’utilizzo di dati proprietari sarà sempre più difficile e costoso. La vendita di contenuti da parte di produttori diventerà sempre più importante così come la produzione di data set sintetici. In quest’ambito si vedranno sviluppi di nuove offerte da parte di start-up e aziende specializzate che diventeranno anche il target di acquisizioni per i grandi player.
Lo sviluppo di applicazioni di AI richiede dati e una infrastruttura tecnologica potente, complessa e costosa anche in termini energetici.
Questo rappresenta un valore che le aziende stanno progressivamente integrando nei loro approcci, poiché vengono sempre più valutate per la loro capacità di assumersi responsabilità non solo sul fronte economico, ma anche su questioni legate alla sostenibilità ambientale.
Ricevi gli articoli degli analisti di The Innovation Group e resta aggiornato sui temi del mercato digitale in Italia!