AIOps per governare la complessità dell’infrastruttura IT di Sky Italia: il progetto EXPLAIN

AI PER LE OPERATIONS
AIOps per governare la complessità dell’infrastruttura IT di Sky Italia: il progetto EXPLAIN
Sky Italia sta sviluppando un progetto in collaborazione con il Competence Center MADE per gestire la crescente complessità della sua infrastruttura IT ibrida attraverso l’AI, focalizzandosi su ingestione dei dati, topology discovery e correlazione degli eventi. Il progetto mira a migliorare l’efficienza, ridurre i tempi di risoluzione dei problemi e ottimizzare i costi operativi.

La crescente complessità delle infrastrutture IT, sempre più ibride e distribuite, rappresenta una sfida significativa per le grandi organizzazioni. Sky Italia, azienda di riferimento nel settore dei media e delle telecomunicazioni, ha intrapreso un percorso strategico per affrontare questa complessità attraverso l’adozione dell’AIOps (Artificial Intelligence for IT Operations). Cuore di questa iniziativa è il progetto EXPLAIN (“Enabling eXtensive Platforms by LTM data and AI Navigation”), sviluppato in collaborazione con il competence center MADE (qui un approfondimento sui servizi AI). L’obiettivo è sfruttare la potenza dell’intelligenza artificiale e del machine learning per automatizzare e ottimizzare la gestione dell’infrastruttura tecnologica, rendendola più efficiente, resiliente e adattiva.
La sfida della complessità IT e la risposta dell’AIOps
Sky Italia opera con infrastrutture tecnologiche che si sono evolute da sistemi monolitici interni a ecosistemi ibridi, distribuiti tra data center proprietari e molteplici cloud pubblici. Questa evoluzione, come ha spiegato Luca Orlando, Senior Manager – Cloud and Infrastructure Transformation di Sky Italia, in occasione di una tavola rotonda organizzata dal Competence Center, ha “aumentato la dimensione delle infrastrutture da controllare, da osservare, i dati da controllare, da analizzare”. In questo scenario l’intelligenza artificiale si propone come uno strumento per “diradare la nebbia nell’ammasso di dati e di informazioni che abbiamo da guardare”.
L’approccio AIOps, come definito da Gartner, combina dati di monitoraggio su larga scala e machine learning per automatizzare i processi operativi IT, inclusa la correlazione di eventi, il rilevamento di anomalie e la determinazione della causalità. Il framework della piattaforma AIOps enfatizza il ruolo trasformativo dei big data e dell’AI, concentrandosi su cinque caratteristiche fondamentali: Ingestion, Topology, Correlation, Recognition e Remediation. Il progetto EXPLAIN di Sky Italia si focalizza sui primi tre livelli, con l’ambizione di portare l’iniziativa AIOps oltre il Technology Readiness Level (TRL) 5, ovvero la fase di dimostrazione tecnologica in ambiente simulato.
Il progetto EXPLAIN: gestire dati, reti e correlazioni per estrarre valore
Il progetto EXPLAIN mira a introdurre innovazioni significative nella gestione dell’infrastruttura IT di Sky Italia, affrontando in modo specifico le sfide legate all’ingestione dei dati, alla scoperta della topologia e alla correlazione degli eventi.
Per quanto riguarda l’Ingestion, EXPLAIN si propone di innovare la gestione di volumi massivi di dati di monitoraggio a lungo termine attraverso una metodologia di “Storage Ibrido”. Questa combina una rappresentazione puntuale dei dati, ideale per catturare punti dati discreti con alta precisione, con una rappresentazione basata su modelli, che astrae e comprime schemi regolari. L’obiettivo è gestire in modo efficiente l’enorme mole di dati generati dall’IT.
Sul fronte della Topology discovery, Sky Italia intende verificare come l’impiego di Large Language Models (LLM) possa automatizzare il processo di mappatura delle interrelazioni e delle dipendenze all’interno dell’ambiente IT. Orlando ha sottolineato come sia fondamentale “costruire una topologia della nostra infrastruttura in modo dinamico”, per mappare in tempo reale le relazioni tra infrastruttura distribuita e applicazioni. Gli LLM, grazie alla loro capacità di processare e comprendere il linguaggio naturale, potrebbero semplificare significativamente questa attività.
Per quanto riguarda la Correlation, il progetto prevede l’adozione di modelli avanzati di apprendimento automatico per analizzare in profondità i dati operativi. Lo scopo è trascendere i metodi convenzionali di monitoraggio, introducendo un sistema capace di rilevare anomalie, anticipare incidenti e interpretare modelli di comportamento operativo che altrimenti potrebbero sfuggire all’analisi manuale. L’AI, in questo contesto, aiuta ad “analizzare, organizzare, arricchire dati e correlarli”, come ha precisato Orlando, per semplificare l’analisi da parte dei team operativi.
Tecnologie e collaborazione per un’infrastruttura più intelligente
Per realizzare gli obiettivi del progetto EXPLAIN, Sky Italia sta sviluppando un’applicazione Cloud Native, dispiegabile su diverse infrastrutture e cloud provider, che si avvale di software open source per la gestione dei dati e di codice proprietario per la gestione dei modelli e degli algoritmi di AI. Per l’interazione uomo-macchina l’azienda sta sperimentando l’utilizzo di LLM forniti da OpenAI, con l’intenzione di esplorare anche altre soluzioni.
Affrontare la complessità del progetto ha richiesto competenze immediatamente disponibili, come ha sottolineato Orlando. Per questo motivo, la collaborazione con MADE e con una startup specializzata in intelligenza artificiale si è rivelata un elemento chiave del percorso intrapreso. Questa sinergia strategica consente a Sky Italia di accedere a un prezioso know-how specialistico, accelerando così la fase cruciale di sperimentazione e validazione del prototipo.
Con i risultati ottenuti dal progetto EXPLAIN Sky Italia mira a raccogliere indicazioni per la futura industrializzazione della soluzione esplorata. L’ambizione è trasformare la gestione della propria infrastruttura IT, rendendola non solo più efficiente e resiliente, ma anche più agile e adattiva: si tratta cioè di andare oltre i limiti delle metodologie tradizionali, adottando una comprensione più olistica dell’ecosistema IT per ottimizzare i costi operativi e ridurre i tempi di risoluzione dei problemi.
L'articolo AIOps per governare la complessità dell’infrastruttura IT di Sky Italia: il progetto EXPLAIN proviene da Innovation Post.
Qual è la tua reazione?






