Dalla disponibilità dei dati alla e sicurezza, dalla selezione al monitoraggio dei modelli: aggiungere l'IA generativa significa poter ripensare l'intera architettura del cloud. Credito: Getty Images Se state costruendo un’architettura cloud e progettando sistemi generativi basati sull’intelligenza artificiale che cosa c’è di nuovo che potete fare? E in che cosa, invece, è più sensato procedere nello stesso modo? Quali sono le best practice emergenti? Dopo aver realizzato alcuni di questi progetti negli ultimi 20 anni, con una particolare attenzione agli ultimi 2, ecco le mie raccomandazioni: Comprendete bene i vostri casi d’uso Definite chiaramente lo scopo e gli obiettivi dell’IA generativa all’interno della vostra architettura cloud. Uno degli errori che vedo più spesso ripetersi, è il non capire il significato dell’IA generativa all’interno dei sistemi aziendali. Comprendere che cosa si vuole ottenere, sia che si tratti di generazione di contenuti, di sistemi di recommendation, o di altre applicazioni. Questo significa mettere nero su bianco e trovare un consenso sugli obiettivi, su come raggiungerli e, soprattutto, su come definire il successo che ci si aspetta di ottenere. Non si tratta di un approccio valido soltanto per l’IA generativa, ma di un passo da compiere in ogni migrazione e in ogni nuovo sistema costruito nel cloud.Vedo interi progetti di IA generativa nella “nuvola” fallire perché non hanno casi d’uso aziendali ben compresi. Le aziende costruiscono qualcosa di bello ma che non restituisce alcun valore. E così non funzionerà. Le fonti e la qualità sono fondamentali Identificate le fonti dei dati necessarie all’addestramento, e l’inferenza del modello di IA generativa. I dati devono essere accessibili, di buona qualità e gestiti con cura. È, inoltre, necessario garantire la disponibilità e la compatibilità con le soluzioni di archiviazione cloud. I sistemi di IA generativa sono fortemente incentrati sui dati. Li definirei sistemi orientati ai dati, che sono il carburante che alimenta il meccanismo. I rifiuti entrano, i rifiuti escono. Pertanto, è utile concentrarsi sull’accessibilità come motore principale dell’architettura cloud. È necessario accedere alla maggior parte dei dati rilevanti, come quelli che riguardano l’addestramento, lasciandoli dove sono e non migrandoli in un’unica entità fisica. Altrimenti, ci si ritroverà con dati ridondanti e senza un’unica fonte di verità. È necessario anche considerare pipeline di dati efficienti per la pre-elaborazione e per la loro pulizia prima di immetterli nei modelli di intelligenza artificiale. Ciò garantisce la qualità delle informazioni, e le prestazioni del modello. Questo aspetto rappresenta circa l’80% del successo delle architetture cloud che utilizzano l’IA generativa. Tuttavia, è spesso trascurato, poiché gli architetti della nuvola si concentrano sull’elaborazione dei sistemi di IA generativa più che sui dati che li alimentano. I dati sono tutto. La sicurezza dei dati e la privacy Così come lo sono i dati in sé, anche la loro sicurezza e la loro privacy sono fondamentali. L’elaborazione dell’IA generativa potrebbe trasformare informazioni apparentemente prive di significato in elementi che possono rivelare informazioni sensibili. Occorre, quindi implementare solide misure di sicurezza, di crittografia e controlli di accesso per proteggere i dati sensibili utilizzati dall’IA generativa e tutti quelli nuovi che può produrre. Come minimo, bisogna rispettare le normative sulla privacy, e ciò non significa aggiungere un sistema di sicurezza all’architettura come ultimo passo: la sicurezza deve essere integrata nei sistemi in ogni fase. Scalabilità e risorse di inferenza Pianificate risorse cloud scalabili per soddisfare carichi di lavoro e richieste di elaborazione variabili. La maggior parte delle aziende prende in considerazione soluzioni di scalabilità automatica e di bilanciamento del carico. Uno degli errori più significativi che vedo è quello di costruire sistemi che scalano bene ma sono estremamente costosi. È meglio bilanciare la scalabilità con l’efficienza dei costi, che si può fare ma che richiede una buona architettura e buone pratiche di finops. Esaminate anche le risorse per la formazione e l’inferenza. Immagino abbiate notato che molte delle novità delle conferenze sul cloud riguardano questo argomento, ed è per una buona ragione. Selezionate istanze cloud appropriate con GPU o TPU per la formazione e l’inferenza dei modelli. Anche in questo caso, ottimizzate l’allocazione delle risorse in base all’efficienza dei costi. Considerate la selezione del modello Scegliete un’architettura di IA generativa esemplare (General Adversarial Network, trasformatori, ecc.) in base al caso d’uso e ai requisiti specifici. Considerate i servizi cloud per la formazione dei modelli, come AWS SageMaker e altri omologhi, e trovate soluzioni ottimizzate. Questo significa anche comprendere che potreste avere molti modelli collegati, il che sarà la norma. Implementare una solida strategia di distribuzione del modello IA, che includa il versioning e la containerizzazione, per renderlo accessibile alle applicazioni e ai servizi della vostra architettura cloud. Monitoraggio e registrazione La creazione di sistemi di monitoraggio e registrazione per monitorare le prestazioni del modello di intelligenza artificiale, l’utilizzo delle risorse, e i potenziali problemi non è facoltativa. Stabilite meccanismi di allerta per le anomalie e sistemi di osservabilità costruiti per gestire l’IA generativa nel cloud. Inoltre, è necessario monitorare e ottimizzare costantemente i costi delle risorse, poiché l’IA generativa può essere ad alta intensità. Utilizzate strumenti e pratiche di gestione dei costi del cloud. I finop provvederanno a monitorare tutti gli aspetti dell’implementazione: come minimo, l’efficienza dei costi operativi come minimo, ma anche quella dell’architettura, più in generale, per valutare se è ottimale. La maggior parte di esse ha bisogno di essere messa a punto e migliorata continuamente. Altre considerazioni Il failover e la ridondanza sono necessari per garantire un’elevata disponibilità, e piani di ripristino d’emergenza possono ridurre al minimo i tempi di inattività e la perdita di dati in caso di guasti del sistema. Implementate la ridondanza dove necessario. Inoltre, verificate e valutate regolarmente la sicurezza del sistema di IA generativa all’interno dell’infrastruttura cloud. Affrontate le vulnerabilità e mantenete la conformità. È una buona idea anche stabilire linee guida per l’utilizzo etico dell’IA, soprattutto quando si generano contenuti o si prendono decisioni che hanno un impatto sugli utenti. Affrontate i problemi di parzialità e correttezza. Attualmente, sono in corso cause legali sull’IA e sulla sua equità, e bisogna, pertanto, assicurarsi di fare sempre la cosa giusta. Valutate costantemente l’esperienza dell’utente per garantire che i contenuti generati dall’IA siano in linea con le loro aspettative e ne migliorino il coinvolgimento. Altri aspetti dell’architettura del cloud computing sono praticamente gli stessi, sia che si utilizzi l’IA generativa sia che non la si utilizzi. La chiave è essere consapevoli che alcuni aspetti sono molto più importanti e occorre essere più rigorosi, e che c’è sempre spazio per i miglioramenti. Contenuti correlati In primo piano Ecco come i CIO stanno ripensando alle strategie sul cloud Facendo tesoro e mettendo in pratica gli insegnamenti appresi dalle prime incursioni nel cloud, i leader IT stanno abbandonando i mantra platform-first a favore di strategie specifiche per i carichi di lavoro, in modo tale da poter decidere con pi&ug Di Paula Rooney 28 Feb 2024 7 minuti Edge Computing Cloud Computing Data Center In primo piano Composability, come costruire - mattone dopo mattone - un’azienda Agile La metodologia Agile è la risposta per i CIO che cercano flessibilità, business continuity e reattività ai cambiamenti. Per molti si tratta di un modello irrinunciabile nello sviluppo del software e della presenza digitale, in pa Di Patrizia Licata 26 Feb 2024 10 minuti Sviluppo Agile Gestione dei processi aziendali Trasformazione digitale In primo piano 4 rischi che possono nascondersi in una strategia cloud aziendale Ci sono difficoltà che hanno la capacità di presentarsi in modo inatteso al cospetto dei leader IT ignari o impreparati sui rischi insiti nelle normative emergenti o sulle carenze che caratterizzano l'approccio al cloud. Di Evan Schuman 21 Feb 2024 9 minuti Gestione del cloud Bilancio Cloud Computing In primo piano La convergenza tra IT e business: ecco come i CIO reinterpretano il loro ruolo con l’aiuto dell’IA Competenza tecnica e conoscenza del business permettono ai CIO di assumere un ruolo sempre più strategico che include il dialogo attivo con i fornitori. Dati, analytics, automazione e intelligenza artificiale sono le basi tecnologiche per il l Di Patrizia Licata 19 Feb 2024 11 minuti CIO Trasformazione digitale Intelligenza artificiale Podcast VIDEOS Risorse Eventi SUBSCRIBE TO OUR NEWSLETTER From our editors straight to your inbox Get started by entering your email address below. Inserisci un indirizzo e-mail valido Abbonarsi