david_linthicum
Di david_linthicum

Ecco come l’intelligenza artificiale generativa può cambiare l’architettura del cloud

Opinione
11 Oct 20236 minuti
Architettura del cloudGenerative AI

Dalla disponibilità dei dati alla e sicurezza, dalla selezione al monitoraggio dei modelli: aggiungere l'IA generativa significa poter ripensare l'intera architettura del cloud.

Getty Images
Credito: Getty Images

Se state costruendo un’architettura cloud e progettando sistemi generativi basati sull’intelligenza artificiale che cosa c’è di nuovo che potete fare? E in che cosa, invece, è più sensato procedere nello stesso modo? Quali sono le best practice emergenti? Dopo aver realizzato alcuni di questi progetti negli ultimi 20 anni, con una particolare attenzione agli ultimi 2, ecco le mie raccomandazioni:

Comprendete bene i vostri casi d’uso

Definite chiaramente lo scopo e gli obiettivi dell’IA generativa all’interno della vostra architettura cloud. Uno degli errori che vedo più spesso ripetersi, è il non capire il significato dell’IA generativa all’interno dei sistemi aziendali. Comprendere che cosa si vuole ottenere, sia che si tratti di generazione di contenuti, di sistemi di recommendation, o di altre applicazioni.

Questo significa mettere nero su bianco e trovare un consenso sugli obiettivi, su come raggiungerli e, soprattutto, su come definire il successo che ci si aspetta di ottenere. Non si tratta di un approccio valido soltanto per l’IA generativa, ma di un passo da compiere in ogni migrazione e in ogni nuovo sistema costruito nel cloud.

Vedo interi progetti di IA generativa nella “nuvola” fallire perché non hanno casi d’uso aziendali ben compresi. Le aziende costruiscono qualcosa di bello ma che non restituisce alcun valore. E così non funzionerà.

Le fonti e la qualità sono fondamentali

Identificate le fonti dei dati necessarie all’addestramento, e l’inferenza del modello di IA generativa. I dati devono essere accessibili, di buona qualità e gestiti con cura. È, inoltre, necessario garantire la disponibilità e la compatibilità con le soluzioni di archiviazione cloud.

I sistemi di IA generativa sono fortemente incentrati sui dati. Li definirei sistemi orientati ai dati, che sono il carburante che alimenta il meccanismo. I rifiuti entrano, i rifiuti escono.

Pertanto, è utile concentrarsi sull’accessibilità come motore principale dell’architettura cloud. È necessario accedere alla maggior parte dei dati rilevanti, come quelli che riguardano l’addestramento, lasciandoli dove sono e non migrandoli in un’unica entità fisica. Altrimenti, ci si ritroverà con dati ridondanti e senza un’unica fonte di verità. È necessario anche considerare pipeline di dati efficienti per la pre-elaborazione e per la loro pulizia prima di immetterli nei modelli di intelligenza artificiale. Ciò garantisce la qualità delle informazioni, e le prestazioni del modello. Questo aspetto rappresenta circa l’80% del successo delle architetture cloud che utilizzano l’IA generativa. Tuttavia, è spesso trascurato, poiché gli architetti della nuvola si concentrano sull’elaborazione dei sistemi di IA generativa più che sui dati che li alimentano. I dati sono tutto.

La sicurezza dei dati e la privacy

Così come lo sono i dati in sé, anche la loro sicurezza e la loro privacy sono fondamentali. L’elaborazione dell’IA generativa potrebbe trasformare informazioni apparentemente prive di significato in elementi che possono rivelare informazioni sensibili.

Occorre, quindi implementare solide misure di sicurezza, di crittografia e controlli di accesso per proteggere i dati sensibili utilizzati dall’IA generativa e tutti quelli nuovi che può produrre. Come minimo, bisogna rispettare le normative sulla privacy, e ciò non significa aggiungere un sistema di sicurezza all’architettura come ultimo passo: la sicurezza deve essere integrata nei sistemi in ogni fase.

Scalabilità e risorse di inferenza

Pianificate risorse cloud scalabili per soddisfare carichi di lavoro e richieste di elaborazione variabili. La maggior parte delle aziende prende in considerazione soluzioni di scalabilità automatica e di bilanciamento del carico. Uno degli errori più significativi che vedo è quello di costruire sistemi che scalano bene ma sono estremamente costosi. È meglio bilanciare la scalabilità con l’efficienza dei costi, che si può fare ma che richiede una buona architettura e buone pratiche di finops. Esaminate anche le risorse per la formazione e l’inferenza. Immagino abbiate notato che molte delle novità delle conferenze sul cloud riguardano questo argomento, ed è per una buona ragione. Selezionate istanze cloud appropriate con GPU o TPU per la formazione e l’inferenza dei modelli. Anche in questo caso, ottimizzate l’allocazione delle risorse in base all’efficienza dei costi.

Considerate la selezione del modello

Scegliete un’architettura di IA generativa esemplare (General Adversarial Network, trasformatori, ecc.) in base al caso d’uso e ai requisiti specifici. Considerate i servizi cloud per la formazione dei modelli, come AWS SageMaker e altri omologhi, e trovate soluzioni ottimizzate. Questo significa anche comprendere che potreste avere molti modelli collegati, il che sarà la norma.

Implementare una solida strategia di distribuzione del modello IA, che includa il versioning e la containerizzazione, per renderlo accessibile alle applicazioni e ai servizi della vostra architettura cloud.

Monitoraggio e registrazione

La creazione di sistemi di monitoraggio e registrazione per monitorare le prestazioni del modello di intelligenza artificiale, l’utilizzo delle risorse, e i potenziali problemi non è facoltativa. Stabilite meccanismi di allerta per le anomalie e sistemi di osservabilità costruiti per gestire l’IA generativa nel cloud.

Inoltre, è necessario monitorare e ottimizzare costantemente i costi delle risorse, poiché l’IA generativa può essere ad alta intensità. Utilizzate strumenti e pratiche di gestione dei costi del cloud. I finop provvederanno a monitorare tutti gli aspetti dell’implementazione: come minimo, l’efficienza dei costi operativi come minimo, ma anche quella dell’architettura, più in generale, per valutare se è ottimale. La maggior parte di esse ha bisogno di essere messa a punto e migliorata continuamente.

Altre considerazioni

Il failover e la ridondanza sono necessari per garantire un’elevata disponibilità, e piani di ripristino d’emergenza possono ridurre al minimo i tempi di inattività e la perdita di dati in caso di guasti del sistema. Implementate la ridondanza dove necessario. Inoltre, verificate e valutate regolarmente la sicurezza del sistema di IA generativa all’interno dell’infrastruttura cloud. Affrontate le vulnerabilità e mantenete la conformità.

È una buona idea anche stabilire linee guida per l’utilizzo etico dell’IA, soprattutto quando si generano contenuti o si prendono decisioni che hanno un impatto sugli utenti. Affrontate i problemi di parzialità e correttezza. Attualmente, sono in corso cause legali sull’IA e sulla sua equità, e bisogna, pertanto, assicurarsi di fare sempre la cosa giusta. Valutate costantemente l’esperienza dell’utente per garantire che i contenuti generati dall’IA siano in linea con le loro aspettative e ne migliorino il coinvolgimento.

Altri aspetti dell’architettura del cloud computing sono praticamente gli stessi, sia che si utilizzi l’IA generativa sia che non la si utilizzi. La chiave è essere consapevoli che alcuni aspetti sono molto più importanti e occorre essere più rigorosi, e che c’è sempre spazio per i miglioramenti.

david_linthicum
Di david_linthicum

David S. Linthicum is an internationally recognized industry expert and thought leader. Dave has authored 13 books on computing, the latest of which is An Insider’s Guide to Cloud Computing. Dave’s industry experience includes tenures as CTO and CEO of several successful software companies, and upper-level management positions in Fortune 100 companies. He keynotes leading technology conferences on cloud computing, SOA, enterprise application integration, and enterprise architecture. Dave writes the Cloud Computing blog for InfoWorld. His views are his own.