Generative AI: vantaggi strategici e limitazioni pratiche dell’ecosistema AWS
13 Agosto 2025 - 13 min. read

Matteo Moroni
DevOps Engineer
Quando si tratta di distribuzione globale dei servizi, viene automatico pensare ad una architettura multi-region.
Tuttavia, esistono casi in cui sfruttando l’AWS Backbone, è possibile ottenere prestazioni del tutto simili, a costi più contenuti.
L’AWS backbone, o AWS Global Network, è l’infrastruttura in fibra ottica privata ad alte prestazioni di Amazon Web Services che collega tra loro AWS Regions, Availability Zones ed Edge Locations dislocate in tutto il mondo. Gestisce il routing e le performance di rete, garantendo costantemente bassa latenza e throughput elevato tra i servizi AWS.
In questo articolo, vediamo quando preferire questa rete ad alta velocità e bassa latenza rispetto alla replica dell’infrastruttura su più region e come sfruttarla in modo ottimale per migliorare l’esperienza utente.
Gli AWS Edge Services sono funzionalità cloud progettate per portare elaborazione, storage e networking più vicini all’utente finale, invece di affidarsi esclusivamente a un’infrastruttura centralizzata nelle AWS Regions. L’obiettivo è ridurre la latenza accorciando fisicamente la distanza che i dati devono percorrere.
Alcuni esempi di edge services sono:
Uno di questi servizi è stato la chiave della nostra soluzione.
L’obiettivo era creare una web application che consentisse agli operatori di distributori automatici di caffè di accedere alle macchine e fornire supporto remoto in caso di problemi. In passato questo veniva fatto con TeamViewer, ma i nuovi modelli di macchine non lo supportavano più, perciò è stata necessaria una soluzione custom basata sul Remote Desktop Protocol (RDP).
Abbiamo deciso di utilizzare Apache Guacamole, un gateway clientless per il remote desktop che supporta RDP.
Quando un operatore installa una nuova macchina, la registra tramite la web app, che la inserisce nell’OpenVPN server e invia il profilo VPN al servizio di telemetria.
Il servizio di telemetria è una web app che utilizza IoT Core e gira nello stesso account AWS della soluzione per il remote desktop. Questo servizio gestisce e fornisce informazioni e funzionalità relative alle macchine da caffè.
Se un utente ha un problema con una macchina, può premere un pulsante per inviare una richiesta di supporto, dando inizio al seguente flusso:
L’intera applicazione era stata distribuita nella Region Irlanda (eu-west-1), la stessa del servizio di telemetria.
Purtroppo la connessione RDP presentava problemi di latenza. Le macchine erano sparse in tutto il mondo e alcune aree disponevano di connessioni internet lente o instabili. In queste condizioni, la connessione RDP risultava quasi inutilizzabile.
Serviva quindi una soluzione per ridurre la latenza tra macchina, operatore e istanza Guacamole.
Un’architettura multi-region consiste nel distribuire i carichi di lavoro in più AWS Regions, in base alla distribuzione degli utenti. In questo modo, la maggior parte degli utenti si collega a una Region geograficamente vicina, minimizzando la latenza.
Tuttavia, questo approccio comporta alcuni compromessi:
Vediamo come questi aspetti impattano il nostro caso:
Sapevamo però come progettare una soluzione più conveniente.
Nel nostro caso, il vero punto di svolta è stato AWS Global Accelerator.
Grazie a Global Accelerator, abbiamo potuto distribuire l’infrastruttura in una sola Region e, al tempo stesso, ridurre la latenza, rendendo la connessione RDP fluida, come se tutti gli utenti si trovassero nella stessa Region dell’infrastruttura.
Questo è possibile perché le connessioni degli utenti e delle macchine viaggiano su Internet solo fino alla AWS Edge Location più vicina. Da lì in poi, il traffico viene instradato attraverso l’AWS Backbone, che garantisce velocità elevata e bassa latenza per la connessione RDP.
Con Global Accelerator siamo riusciti a ottenere performance molto vicine a quelle di una soluzione multi-region, ma con costi poco superiori a quelli di una distribuzione single-region.
Nella progettazione di soluzioni globali, la raccomandazione predefinita è spesso quella di adottare un’architettura multi-region per:
Tuttavia, abbiamo visto che non sempre la strategia multi-region è la migliore, soprattutto quando occorre contenere i costi e non è sostenibile replicare licenze o servizi onerosi in ogni regione.
In questi casi, sfruttare servizi basati sull’AWS Backbone, come AWS Global Accelerator, può rappresentare un’ottima alternativa: performance quasi equivalenti a una distribuzione multi-region, ma con costi e complessità molto più vicini a una single-region.
Proud2beCloud è il blog di beSharp, APN Premier Consulting Partner italiano esperto nella progettazione, implementazione e gestione di infrastrutture Cloud complesse e servizi AWS avanzati. Prima di essere scrittori, siamo Solutions Architect che, dal 2007, lavorano quotidianamente con i servizi AWS. Siamo innovatori alla costante ricerca della soluzione più all'avanguardia per noi e per i nostri clienti. Su Proud2beCloud condividiamo regolarmente i nostri migliori spunti con chi come noi, per lavoro o per passione, lavora con il Cloud di AWS. Partecipa alla discussione!