{"id":3013,"date":"2021-04-16T13:59:00","date_gmt":"2021-04-16T11:59:00","guid":{"rendered":"https:\/\/blog.besharp.it\/?p=3013"},"modified":"2023-03-29T15:34:42","modified_gmt":"2023-03-29T13:34:42","slug":"aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice","status":"publish","type":"post","link":"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/","title":{"rendered":"AWS Glue Elastic Views! Framework per ETL e Aggregazione (quasi) senza codice"},"content":{"rendered":"\n<h2 class=\"wp-block-heading\">Introduzione<\/h2>\n\n\n\n<p><strong>L\u2019ETL<\/strong> rappresenta uno step fondamentale in un processo di Machine Learning in quanto \u00e8 il trampolino di lancio su cui si basa tutto il set di dati per la definizione del modello, per questo i <strong>data scientist e gli esperti MLOps pianificano attentamente i job e le pipeline per gestire l&#8217;estrazione dei dati dai database<\/strong>, spesso di natura diversa, <strong>pulendo<\/strong> e n<strong>ormalizzando i dati<\/strong> ed infine, <strong>generando un data lake<\/strong>per migliorare ulteriormente i dati durante il processo di indagine.<\/p>\n\n\n\n<p>Di solito, questo processo prevede diversi passaggi, il coordinamento della loro esecuzione, l&#8217;accesso a diversi database con diverse tecnologie, la preparazione di molti script, la conoscenza di diversi linguaggi per interrogare i dati rilevanti e cos\u00ec via.<\/p>\n\n\n\n<p>Prendersi cura di tutti questi passaggi \u00e8 un compito ardito e richiede molta esperienza e, naturalmente, tempo, minando l&#8217;efficienza dell&#8217;intero progetto che si deve gestire.<\/p>\n\n\n\n<p>AWS, che sta progredendo molto rapidamente negli ultimi due anni nello <strong>sviluppo di strumenti e servizi per aiutare nelle attivit\u00e0 di machine learning<\/strong>, questa volta ci porta un altro importante servizio in soccorso: <strong>AWS Elastic Views<\/strong>. <\/p>\n\n\n\n<p><strong>AWS Elastic Views consente a un utente di richiedere dati da diverse fonti in modo completamente indipendente dalla loro natura, di eseguire query per i dati in un linguaggio compatibile con SQL e di inviare tutti i dati interrogati a una destinazione, tipicamente S3 o un&#8217;altra destinazione dati, ed infine a produrre un data lake con cui lavorare.<\/strong><\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter\"><img decoding=\"async\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image8.png\" alt=\"AWS Glue Elastic Views (Preview)\"\/><\/figure><\/div>\n\n\n<p>Alcuni dei principali vantaggi sono: <\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Essere in grado di interrogare un database qualsiasi o un datastream di diversa natura in linguaggio PartiQL, diventando di fatto un sistema di aggregazione, senza la necessit\u00e0 di scrivere workload ETL complessi e personalizzati.<\/li>\n\n\n\n<li>Utilizzo di comandi potenti come JOIN per aggiungere funzionalit\u00e0 di aggregazione a origini dati che di solito non hanno tale capacit\u00e0.<\/li>\n<\/ul>\n\n\n\n<p>Lo scopo di questo articolo \u00e8 guidare il lettore nell&#8217;esplorazione di alcuni dei fattori chiave che rendono questo servizio qualcosa di cui essere definitivamente consapevoli nei propri progetti di Machine Learning.<\/p>\n\n\n\n<p>Esploreremo in profondit\u00e0 ci\u00f2 che \u00e8 in grado di fare AWS Elastic Views, considerando per\u00f2 che \u00e8 ancora in fase beta, quindi si dovr\u00e0 richiedere l&#8217;accesso ad AWS per l&#8217;anteprima.<\/p>\n\n\n\n<p>Cominciamo! <\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Come funziona<\/h2>\n\n\n\n<p>Cominciamo il nostro viaggio capendo che <strong>cos\u2019\u00e8 AWS Glue Elastic Views, e come funziona<\/strong>. Per prima cosa, diamo uno sguardo allo schema fornito da AWS:<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"424\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image13-1024x424.png\" alt=\"AWS Glue Elastic Views how it works\" class=\"wp-image-3004\" srcset=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image13-1024x424.png 1024w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image13-400x165.png 400w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image13-768x318.png 768w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image13-1536x635.png 1536w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image13.png 1970w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Courtesy of AWS &#8211; AWS Glue Elastic Views inputs and outputs<\/em><\/figcaption><\/figure><\/div>\n\n\n<p>Come mostrato nell&#8217;immagine, il punto focale di questo servizio \u00e8 rappresentato dalla <strong>Materialized View,<\/strong> che \u00e8 un sistema per astrarre il set di dati da qualsiasi tipo di sorgente: ad esempio Amazon Aurora, RDS o DynamoDB. Ci\u00f2 consente di mantenere le informazioni sincronizzate senza l&#8217;uso effettivo di un Glue Crawler, come ci saremmo aspetti dai nostri altri articoli sui workload ETL (<a href=\"https:\/\/blog.besharp.it\/it\/orchestrare-pipeline-etl-su-aws-con-aws-glue-aws-stepfunctions-e-aws-cloudformation\/\" target=\"_blank\" rel=\"noreferrer noopener\">qui<\/a> e <a href=\"https:\/\/blog.besharp.it\/it\/deploy-di-una-pipeline-di-real-time-data-ingestion-e-analytics-con-aws-iot-core-amazon-kinesis-e-amazon-sagemaker\/\" target=\"_blank\" rel=\"noreferrer noopener\">qui<\/a> alcuni esempi).<\/p>\n\n\n\n<p>Ma diamo un&#8217;occhiata in dettaglio alle caratteristiche principali e come possono essere utili.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Usare SQL come mezzo per creare una view<\/h4>\n\n\n\n<p>AWS Glue Elastic Views consente a uno sviluppatore di creare viste materializzate su diverse origini di dati, utilizzando query SQL per aggregare i dati. AWS Glue Elastic Views attualmente supporta Amazon DynamoDB, Redshift, S3 e Elasticsearch Service. Inoltre, AWS ha in programma di aggiungere ancora pi\u00f9 origini di dati in futuro.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Copiare autonomamente da una fonte dati ad un datalake target<\/h4>\n\n\n\n<p>AWS Glue Elastic Views gestisce per noi il lavoro pi\u00f9 pesante di copia e aggregazione dei dati da tutte le origini dati fino agli archivi di destinazione, senza dover scrivere codice personalizzato o utilizzare strumenti ETL e linguaggi di programmazione complessi o sconosciuti, con un effetto benefico sia sul tempo che sull&#8217;efficienza del progetto. AWS Glue Elastic Views riduce il tempo necessario per combinare e replicare i dati negli archivi dati da mesi a minuti, secondo AWS.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Mantenere i dati nella destinazione sempre aggiornati, automaticamente<\/h4>\n\n\n\n<p>Mantenere i dati sincronizzati di solito richiede la creazione e la manutenzione di crawler, AWS Glue Elastic Views, invece, monitora continuamente le modifiche ai dati negli archivi dati iniziali e, quando si verifica una modifica, Elastic Views aggiorna automaticamente le destinazioni. Ci\u00f2 garantisce che le applicazioni che accedono ai dati utilizzando Elastic Views dispongano sempre dei dati pi\u00f9 aggiornati.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Avvisare quando avviene un cambiamento nei dati di un data store sorgente<\/h4>\n\n\n\n<p>AWS Glue Elastic Views avvisa in modo proattivo gli sviluppatori quando viene apportata una modifica al modello di dati in uno degli archivi dati di origine, in modo che possano aggiornare le loro visualizzazioni per adattarsi a questa modifica velocemente.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Serverless<\/h4>\n\n\n\n<p>AWS Glue Elastic Views \u00e8 completamente serverless e aumenta o diminuisce automaticamente la propria capacit\u00e0 per adattarsi automaticamente ai carichi di lavoro. Non c&#8217;\u00e8 hardware o software da gestire e, come sempre, un utente paga solo per le risorse che utilizza.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Registrarsi per la preview gratuita<\/h2>\n\n\n\n<p>Essendo un servizio ancora in beta \u00e8 necessario registrarsi per la preview gratuita: per farlo, \u00e8 sufficiente andare a questo <a href=\"https:\/\/pages.awscloud.com\/AWS-Glue-Elastic-Views-Preview.html\">indirizzo<\/a> e registrarsi, compilando l\u2019apposito form.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"299\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image5-1-1024x299.png\" alt=\"AWS Glue Elastic Views apply for access\" class=\"wp-image-2988\" srcset=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image5-1-1024x299.png 1024w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image5-1-400x117.png 400w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image5-1-768x224.png 768w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image5-1-1536x448.png 1536w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image5-1.png 1999w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Spaccato del modulo di registrazione alla preview<\/em><\/figcaption><\/figure><\/div>\n\n\n<p>Verranno richiesti i dettagli personali e aziendali, nonch\u00e9 un&#8217;introduzione di base al problema che si desidera risolvere utilizzando AWS Glue Elastic Views. \u00c8 bene Assicurarsi di fornire motivazioni ragionevoli, poich\u00e9 casi d&#8217;uso interessanti aumentano le possibilit\u00e0 di essere selezionati per l&#8217;anteprima. <\/p>\n\n\n\n<p>Di solito, AWS risponde entro una settimana e se idoneo per l&#8217;anteprima, il seguente messaggio verr\u00e0 inviato alla propria email.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"185\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image3-1-1024x185.png\" alt=\"AWS Glue Elastic Views preview email\" class=\"wp-image-2984\" srcset=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image3-1-1024x185.png 1024w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image3-1-400x72.png 400w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image3-1-768x138.png 768w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image3-1-1536x277.png 1536w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image3-1.png 1942w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>La mail di preview<\/em><\/figcaption><\/figure><\/div>\n\n\n<p>Dopo essersi registrati, per accedere a Glue Elastic View \u00e8 necessario cliccare sul link fornito nella mail.<\/p>\n\n\n\n<p>Ora siamo pronti per iniziare il nostro primo workload ETL con Elastic View, invece di utilizzare script Spark standard o Glue Crawler.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Entriamo nel vivo del nostro test<\/h2>\n\n\n\n<p>Il modo migliore per capire le possibilit\u00e0 di questo servizio \u00e8 metterci alla prova con esso. Quindi abbiamo deciso di creare un semplice caso d&#8217;uso per presentare come potrebbe essere utilizzato per semplificare i propri workload ETL.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"394\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image11-1024x394.png\" alt=\"AWS Glue Elastic Views test case\" class=\"wp-image-3000\" srcset=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image11-1024x394.png 1024w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image11-400x154.png 400w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image11-768x296.png 768w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image11.png 1039w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Schema del nostro esempio semplificato<\/em><\/figcaption><\/figure><\/div>\n\n\n<h3 class=\"wp-block-heading\">Panoramica<\/h3>\n\n\n\n<p>L&#8217;idea di base \u00e8 popolare una tabella DynamoDB con alcuni dati di test ottenuti da fonti di dati gratuite. Vogliamo estrarre e manipolare i dati da questa tabella per dimostrare come Glue Elastic Views pu\u00f2 aggiungere efficacemente funzionalit\u00e0 ETL a DynamoDB, che \u00e8 storicamente un po&#8217; debole su questo aspetto. <\/p>\n\n\n\n<p>Quindi vogliamo inviare questi dati a S3 e verificare che sia possibile aggiornarli in tempo reale per riflettere i cambiamenti, dimostrando come Glue Elastic Views pu\u00f2 accelerare efficacemente il processo di indagine di una pipeline di Machine Learning.<\/p>\n\n\n\n<p>Nota: <em>al momento della scrittura di questo articolo, sfortunatamente, l&#8217;operazione JOIN non \u00e8 supportata per PartiQL in AWS Glue Elastic Views, quindi abbiamo optato per testare alcune operazioni matematiche e logiche, oltre a convalidare tutti i passaggi per sincronizzare la tabella DynamoDB con il bucket S3.<\/em><\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Dataset<\/h3>\n\n\n\n<p>Per il nostro esempio, abbiamo deciso di utilizzare un semplice <a href=\"https:\/\/www.kaggle.com\/NUFORC\/ufo-sightings\" target=\"_blank\" rel=\"noreferrer noopener\">set di dati sugli avvistamenti UFO<\/a>. Vogliamo mettere questo file CSV in una tabella DynamoDB, come detto prima, e applicare alcune operazioni di filtraggio sui campi di latitudine e longitudine, o anche citt\u00e0. Il risultato verr\u00e0 utilizzato per rispondere alla seguente domanda di esempio: &#8220;In che modo gli avvistamenti UFO variano a seconda delle diverse zone?&#8221;.<br><br>Questo \u00e8, ovviamente, solo un semplice esempio, non ha implicazioni pratiche a parte dimostrare alcune funzionalit\u00e0 di AWS Glue Elastic Views.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Importare i dati in DynamoDB<\/h3>\n\n\n\n<p>Vogliamo creare la tabella per DynamoDB, e per fare questo, abbiamo definito un semplice script, in SageMaker Studio, che si sobbarchi l\u2019operazione per noi.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"127\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image9-1024x127.png\" alt=\"a simple script, in SageMaker Studio to import data\" class=\"wp-image-2996\" srcset=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image9-1024x127.png 1024w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image9-400x50.png 400w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image9-768x95.png 768w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image9-1536x191.png 1536w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image9.png 1999w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>SageMaker Studio: interfaccia<\/em><\/figcaption><\/figure>\n\n\n\n<p>Fondamentalmente andiamo a leggere i dati dal file CSV usando Pandas, convertiamo le righe in JSON, ma prima di farlo, aggiungiamo anche una colonna &#8220;hash&#8221; chiamata <strong>id<\/strong>, perch\u00e9 DynamoDB ha bisogno di una chiave primaria per ogni item.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code> for record in json_list:\n        if record&#91;'longitude '] and record&#91;'latitude']:\n    record&#91;'id'] = sha256(str(record).encode()).hexdigest()<\/code><\/pre>\n\n\n\n<p>Il set di dati sugli UFO presentava anche alcuni problemi che dovevano essere risolti: l\u2019header &#8220;longitudine&#8221; aveva degli spazi da rimuovere e le colonne di latitudine e longitudine dovevano essere convertite in formato stringa rimuovendo le voci NaN.<\/p>\n\n\n\n<p>Infine, abbiamo utilizzato boto3 per creare una tabella corrispondente al CSV.<\/p>\n\n\n\ndynamodb = boto3.resource(&#8216;dynamodb&#8217;)\ntable = dynamodb.Table(&#8216;article_ufo_sightings&#8217;)\nwith table.batch_writer() as batch:\n&#8230;\nbatch.put_item(Item=record)\n\n\n\n<p>Il codice completo pu\u00f2 essere esplorato <a href=\"https:\/\/github.com\/besharpsrl\/glue-elastic-view-example\">qui<\/a>.<\/p>\n\n\n\n<p>Nota: <em>avremmo potuto utilizzare AWS Glue anche per questa attivit\u00e0, inserendo il file CSV in un bucket S3 di origine, utilizzando poi Glue Crawler per importare i dati, ma poich\u00e9 abbiamo gi\u00e0 trattato i lavori ETL con questo servizio in altri <\/em><a href=\"https:\/\/blog.besharp.it\/it\/deploy-di-una-pipeline-di-real-time-data-ingestion-e-analytics-con-aws-iot-core-amazon-kinesis-e-amazon-sagemaker\/\"><em>articoli,<\/em><\/a><em>abbiamo optato per una soluzione pi\u00f9 semplice non essendo questo il fulcro dell&#8217;esempio.<\/em><\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Creare la tabella in DynamoDB<\/h3>\n\n\n\n<p>Siamo semplicemente andati alla console DynamoDB, abbiamo cliccato su &#8220;create table&#8221; e abbiamo utilizzato le semplici impostazioni segnate in immagine. Una nota per\u00f2: applichiamo la modalit\u00e0 di capacit\u00e0 <strong>on-demand<\/strong> per velocizzare la generazione della tabella.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"413\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image10-1024x413.png\" alt=\"DynamoDB Table creation\" class=\"wp-image-2998\" srcset=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image10-1024x413.png 1024w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image10-400x161.png 400w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image10-768x310.png 768w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image10-1536x619.png 1536w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image10.png 1999w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Settaggi per la tabella &#8211; id come chiave primaria e on-demand per la capacity mode<\/em><\/figcaption><\/figure><\/div>\n\n\n<p>Aggiungiamo <strong>id<\/strong> come chiave primaria per la tabella UFO sightings <\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Creare una Materialized View dalla tabella<\/h3>\n\n\n\n<p>Prima di generare la vista, dovevamo aggiungere la tabella DynamoDB come sorgente in AWS Glue Elastic Views; per farlo, siamo andati alla console principale, abbiamo selezionato \u201cTables\u201d a sinistra e cliccato su \u201cCreate Table\u201d. Quindi abbiamo selezionato la nuova tabella DynamoDB, generata nei passaggi precedenti.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"180\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image1-1-1024x180.png\" alt=\"Tabella di partenza per la Materialized View\" class=\"wp-image-2980\" srcset=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image1-1-1024x180.png 1024w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image1-1-400x70.png 400w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image1-1-768x135.png 768w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image1-1-1536x270.png 1536w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image1-1.png 1999w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Tabella di partenza per la Materialized View<\/em><\/figcaption><\/figure><\/div>\n\n\n<p>Il passaggio successivo \u00e8 stato applicare alcuni filtri per creare il nostro set di dati di destinazione finale, dipendente dalla vista. <\/p>\n\n\n\n<p>Andando sulla scheda &#8220;Views&#8221; sul lato sinistro della console ne abbiamo creata una nuova. Qui ci \u00e8 stata presentata la possibilit\u00e0 di scrivere codice PartiQL personalizzato: esattamente quello che volevamo!<\/p>\n\n\n\n<p>Abbiamo aggiunto il seguente codice nell&#8217;editor per abilitare la nostra vista materializzata:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>SELECT id, Latitude, Longitude FROM article_ufo_sightings.article_ufo_sightings<\/code><\/pre>\n\n\n\n<p>Abbiamo anche dovuto scrivere tutti gli attributi che volevamo esportare nei file di parquet di destinazione (sembra che AWS Glue Elastic Views generi batch di file di parquet nella directory di output).<\/p>\n\n\n\n<p>Come il lettore pu\u00f2 osservare dal codice sopra, abbiamo evitato di richiedere apposta informazioni utili: volevamo mostrare che \u00e8 possibile modificare la vista in tempo reale dopo che la materialized view \u00e8 stata creata.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Inviare i dati ad Amazon S3<\/h3>\n\n\n\n<p>Al momento della scrittura di questo articolo, S3 \u00e8 una delle tre opzioni disponibili come target, insieme a ElasticSearch e Redshift. Nel nostro caso S3 \u00e8 la destinazione ideale, in quanto vogliamo che il set di dati finale venga consumato da SageMaker. <\/p>\n\n\n\n<p>Siamo andati dentro la View e abbiamo cliccato su \u201cMaterialized View\u201d, quindi abbiamo selezionato \u201cGlue EV\u201d come supporto per sbloccare \u201cS3\u201d come target: l\u00ec abbiamo aggiunto il bucket \u201carticle-ufo-materialized-views\u201d e selezionato default come crittografia; abbiamo aggiunto un ruolo IAM adatto per l&#8217;esecuzione. <\/p>\n\n\n\n<p>Il ruolo pu\u00f2 essere creato utilizzando l&#8217;<strong>editor per ruoli e policy di AWS<\/strong>, tenendo per\u00f2 a mente che, una volta creato, si dovr\u00e0 modificare la <strong>trust relationship<\/strong> con il seguente codice per abilitare il ruolo IAM, altrimenti non saremo in grado di vedere il ruolo nel selettore:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code> \"Version\": \"2012-10-17\",\n \"Statement\": &#91;\n  {\n \"Effect\": \"Allow\",\n \"Principal\": {\n \"Service\": &#91;\n \"materializedviews.amazonaws.com\"\n ]\n  },\n \"Action\": \"sts:AssumeRole\"\n  }\n ]\n}<\/code><\/pre>\n\n\n\n<p>Qui abbiamo invece uno screenshot con i parametri utilizzati:<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"907\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image4-1-1024x907.png\" alt=\"Materialized View - settaggi di destinazione su S3\" class=\"wp-image-2986\" srcset=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image4-1-1024x907.png 1024w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image4-1-339x300.png 339w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image4-1-768x680.png 768w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image4-1-1536x1361.png 1536w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image4-1.png 1596w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Materialized View &#8211; settaggi di destinazione su S3<\/em><\/figcaption><\/figure><\/div>\n\n\n<p>Una volta creata, la vista deve essere attivata per sincronizzarsi con il bucket S3; per farlo, siamo andati sia nella tabella che nella vista che avevamo creato, e abbiamo cliccato su \u201cAttiva\u201d nel loro pannello di dettaglio.<\/p>\n\n\n\n<p>Dopo un paio di minuti dall&#8217;attivazione, il bucket S3 \u00e8 stato riempito con i dati risultanti!<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"463\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image12-1024x463.png\" alt=\"ufo resulting data \" class=\"wp-image-3002\" srcset=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image12-1024x463.png 1024w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image12-400x181.png 400w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image12-768x347.png 768w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image12-1536x695.png 1536w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image12.png 1999w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>I dati di destinazione<\/em><\/figcaption><\/figure><\/div>\n\n\n<p>Fatto interessante: appena prima di attivare la visualizzazione, il servizio si \u00e8 lamentato del fatto che alcuni campi non fossero compatibili con il target di output e ci ha dato la possibilit\u00e0 di modificare la visualizzazione al volo con un editor in linea, questo \u00e8 quello che abbiamo fatto per castare &#8220;Latitudine&#8221; e &#8220;Longitudine&#8221; a numero intero:<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image2-1-1024x118.png\" alt=\"Applichiamo il cast sui dati per evitare le incompatibilit\u00e0\" class=\"wp-image-2982\" width=\"840\" height=\"96\" srcset=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image2-1-1024x118.png 1024w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image2-1-400x46.png 400w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image2-1-768x88.png 768w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image2-1-1536x177.png 1536w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image2-1.png 1774w\" sizes=\"auto, (max-width: 840px) 100vw, 840px\" \/><\/figure><\/div>\n\n\n<p>I dati sono ora collegati direttamente con il nostro bucket S3, quindi qualsiasi modifica apportata alla tabella si riflette direttamente dopo alcuni secondi. Fondamentalmente \u00e8 come avere un Glue Crawler che funziona su richiesta, che si accende e si spegne quando necessario, e senza intervento umano.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Modifichiamo i dati su S3<\/h3>\n\n\n\n<p>Volevamo dimostrare che \u00e8 possibile modificare i dati ottenuti dalla tabella DynamoDB in qualsiasi momento, per questo abbiamo iniziato salvando &#8220;file parquet incompleti&#8221; come il lettore pu\u00f2 osservare qui:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"810\" height=\"390\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image7.png\" alt=\"Dataset incompleto con id, Latitudine e Longitudine\" class=\"wp-image-2993\" srcset=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image7.png 810w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image7-400x193.png 400w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image7-768x370.png 768w\" sizes=\"auto, (max-width: 810px) 100vw, 810px\" \/><figcaption class=\"wp-element-caption\"><em>Dataset incompleto con id, Latitudine e Longitudine<\/em><\/figcaption><\/figure>\n\n\n\n<p>Per modificare il nostro set di dati finale dovevamo prima &#8220;disattivare&#8221; la vista materializzata. Successivamente, \u00e8 stato possibile definire una nuova vista Materializzata sullo stesso target aggiungendo pi\u00f9 colonne. Si noti inoltre che, se si dispone di pi\u00f9 visualizzazioni dipendenti l&#8217;una dall&#8217;altra, \u00e8 necessario disattivarle ed eliminarle nell&#8217;ordine corretto. Forse questa operazione diventer\u00e0 meno macchinosa al momento del rilascio ufficiale. <\/p>\n\n\n\n<p>Abbiamo modificato la definizione originale della vista materializzata aggiungendo pi\u00f9 colonne:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>SELECT id,cast(City as string),cast(State as string),cast(Shape as string),cast(Latitude as integer),cast(Longitude as integer) FROM article_ufo_sightings.article_ufo_sightings;<\/code><\/pre>\n\n\n\n<p>Nonostante il processo non proprio lineare, queste operazioni hanno richiesto meno di 5 minuti e i nuovi dati sono stati presto resi disponibili nel bucket S3 corretto:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"815\" height=\"255\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image6.png\" alt=\"Dataset con tutte le colonne\" class=\"wp-image-2991\" srcset=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image6.png 815w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image6-400x125.png 400w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/image6-768x240.png 768w\" sizes=\"auto, (max-width: 815px) 100vw, 815px\" \/><figcaption class=\"wp-element-caption\"><em>Dataset con tutte le colonne<\/em><\/figcaption><\/figure>\n\n\n\n<p>Ovviamente se le modifiche si trovano nella tabella originale e non nella vista, gli aggiornamenti sono completamente \u201cseamless\u201d come ci si aspetterebbe.<\/p>\n\n\n\n<p>Un altro promemoria: essendo l&#8217;interfaccia ancora in fase di anteprima, consigliamo di evitare di lanciare molte operazioni in poco tempo, poich\u00e9 abbiamo riscontrato diversi bug legati a \u201crace condition\u201d non ancora gestite correttamente.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Ora possiamo farci del Machine Learning!<\/h3>\n\n\n\n<p>Per verificare che il datasource target sia sfruttabile per lavori di machine learning, abbiamo anche preparato un semplice Jupiter Notebook di test per SageMaker, applicando alcune semplici analisi di correlazione sul data lake creato. Tutto questo si pu\u00f2 vedere in dettaglio nel <a href=\"https:\/\/github.com\/besharpsrl\/glue-elastic-view-example\">notebook<\/a>. L&#8217;idea era di verificare se esiste una sorta di correlazione tra luoghi, citt\u00e0 e avvistamenti UFO e, sulla base dei dati di esempio, provare a fare alcune semplici inferenze. Ulteriori informazioni su come utilizzare SageMaker per fare inferenza sono state trattate in <a href=\"https:\/\/blog.besharp.it\/it\/deploy-di-una-pipeline-di-real-time-data-ingestion-e-analytics-con-aws-iot-core-amazon-kinesis-e-amazon-sagemaker\/\">questo articolo.<\/a><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Referenze<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/pages.awscloud.com\/AWS-Glue-Elastic-Views-Preview.html\">https:\/\/pages.awscloud.com\/AWS-Glue-Elastic-Views-Preview.html<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/aws.amazon.com\/glue\/features\/elastic-views\/\">https:\/\/aws.amazon.com\/glue\/features\/elastic-views\/<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/aws.amazon.com\/glue\/faqs\/\">https:\/\/aws.amazon.com\/glue\/faqs\/<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/cloudacademy.com\/course\/aws-reinvent-2020-aws-glue-elastic-views-1209\/aws-glue-elastic-views\/\">https:\/\/cloudacademy.com\/course\/aws-reinvent-2020-aws-glue-elastic-views-1209\/aws-glue-elastic-views\/<\/a><\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Per concludere<\/h2>\n\n\n\n<p>Siamo giunti alla fine di questo viaggio nelle meraviglie di AWS Elastic Views, quindi \u00e8 il momento di riassumere ci\u00f2 che abbiamo imparato finora.<\/p>\n\n\n\n<p>Questo servizio AWS si rivela prezioso quando si tratta di lavorare con molte origini dati, soprattutto se di diversa natura, in quanto recupera e interroga tutti i dati con un linguaggio compatibile SQL (PartiQL), evitando la creazione di molti lavori ETL Glue complessi.<\/p>\n\n\n\n<p><strong>\u00c8 perfetto in tutte quelle situazioni in cui \u00e8 necessario combinare dati legacy e nuovi<\/strong>, poich\u00e9 di solito risiedono, come da best practice, su diverse origini dati: quelle pi\u00f9 economiche per gli accessi poco frequenti e quelle con bassa latenza per i nuovi dati.<\/p>\n\n\n\n<p>Se vogliamo utilizzare S3 come target, diventa una soluzione <strong>adatta per job di SageMaker o anche per attivit\u00e0 che sfruttano i servizi di AWS Managed Machine Learning<\/strong>.<\/p>\n\n\n\n<p>Se ElasticSearch \u00e8 il target designato, Elastic Views diventa perfetto per i workload di Business Intelligence.<\/p>\n\n\n\n<p>AWS Elastic Views supporta gli aggiornamenti in tempo reale sui dati, con la possibilit\u00e0 di aggiornare anche un singolo valore per riflettere le modifiche; tutto questo utilizzando un linguaggio SQL semplice e universalmente noto, che offre funzionalit\u00e0 SQL per i database che non le supportano.<\/p>\n\n\n\n<p>Potendo aggiornare un singolo campo, evita di eseguire nuovamente la scansione di tutti i dati in un&#8217;origine dati per aggiornare la destinazione scelta.<\/p>\n\n\n\n<p>Infine, vorremmo dare un consiglio: poich\u00e9 la preview attuale \u00e8 ancora in una fase molto preliminare, la maggior parte delle funzionalit\u00e0 descritte non sono ancora disponibili completamente per una prova, quindi anche se il prodotto \u00e8 gi\u00e0 utile in diversi casi, \u00e8 bene sperimentare prima di utilizzarlo per i lavori di produzione o attendere il rilascio pubblico.<\/p>\n\n\n\n<p>Ed eccoci qui! Ci auguriamo che la lettura ti sia piaciuta e che abbia fornito utili spunti. Come sempre, sentiti libero di commentare nella sezione sottostante e <a href=\"mailto:info@proud2becloud.com\" target=\"_blank\" rel=\"noreferrer noopener\">contattaci<\/a> per qualsiasi dubbio, domanda o idea!<\/p>\n\n\n\n<p>Ci vediamo su #<strong>Proud2beCloud<\/strong>tra un paio di settimane per un&#8217;altra storia!<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Introduzione L\u2019ETL rappresenta uno step fondamentale in un processo di Machine Learning in quanto \u00e8 il trampolino di lancio su [&hellip;]<\/p>\n","protected":false},"author":6,"featured_media":3022,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[474],"tags":[490,251,492,410,418,463,424,416,267],"class_list":["post-3013","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-analytics","tag-amazon-dynamodb-it","tag-amazon-s3","tag-aws-glue-elastic-views-it","tag-data-analytics","tag-data-ingestion","tag-data-lake","tag-dataset","tag-etl","tag-serverless"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v24.7 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>AWS Glue Elastic Views! Framework per ETL e Aggregazione (quasi) senza codice - Proud2beCloud Blog<\/title>\n<meta name=\"description\" content=\"Abbiamo testato il servizio AWS Glue Elastic Views, annunciato allo scorso re:Invent e ancora in preview. Ecco cosa ne pensiamo!\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/\" \/>\n<meta property=\"og:locale\" content=\"it_IT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"AWS Glue Elastic Views! Framework per ETL e Aggregazione (quasi) senza codice\" \/>\n<meta property=\"og:description\" content=\"Abbiamo testato il servizio AWS Glue Elastic Views, annunciato allo scorso re:Invent e ancora in preview. Ecco cosa ne pensiamo!\" \/>\n<meta property=\"og:url\" content=\"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/\" \/>\n<meta property=\"og:site_name\" content=\"Proud2beCloud Blog\" \/>\n<meta property=\"article:published_time\" content=\"2021-04-16T11:59:00+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2023-03-29T13:34:42+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/twitter-shared-link-3.png\" \/>\n<meta name=\"author\" content=\"Alessandro Gaggia\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:title\" content=\"AWS Glue Elastic Views! Framework per ETL e Aggregazione (quasi) senza codice\" \/>\n<meta name=\"twitter:description\" content=\"Abbiamo testato il servizio AWS Glue Elastic Views, annunciato allo scorso re:Invent e ancora in preview. Ecco cosa ne pensiamo!\" \/>\n<meta name=\"twitter:image\" content=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/twitter-shared-link-3.png\" \/>\n<meta name=\"twitter:label1\" content=\"Scritto da\" \/>\n\t<meta name=\"twitter:data1\" content=\"Alessandro Gaggia\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tempo di lettura stimato\" \/>\n\t<meta name=\"twitter:data2\" content=\"17 minuti\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/\",\"url\":\"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/\",\"name\":\"AWS Glue Elastic Views! Framework per ETL e Aggregazione (quasi) senza codice - Proud2beCloud Blog\",\"isPartOf\":{\"@id\":\"https:\/\/blog.besharp.it\/it\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/beSharp_blog_Copertine_2021_15_04_2021_15_04_2021.png\",\"datePublished\":\"2021-04-16T11:59:00+00:00\",\"dateModified\":\"2023-03-29T13:34:42+00:00\",\"author\":{\"@id\":\"https:\/\/blog.besharp.it\/it\/#\/schema\/person\/f27fc12d10867c6ea6e0158ce4dd8924\"},\"description\":\"Abbiamo testato il servizio AWS Glue Elastic Views, annunciato allo scorso re:Invent e ancora in preview. Ecco cosa ne pensiamo!\",\"breadcrumb\":{\"@id\":\"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/#breadcrumb\"},\"inLanguage\":\"it-IT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"it-IT\",\"@id\":\"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/#primaryimage\",\"url\":\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/beSharp_blog_Copertine_2021_15_04_2021_15_04_2021.png\",\"contentUrl\":\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/beSharp_blog_Copertine_2021_15_04_2021_15_04_2021.png\",\"width\":1668,\"height\":1250,\"caption\":\"AWS Glue Elastic Views! Framework per ETL e Aggregazione (quasi) senza codice\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/blog.besharp.it\/it\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"AWS Glue Elastic Views! Framework per ETL e Aggregazione (quasi) senza codice\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/blog.besharp.it\/it\/#website\",\"url\":\"https:\/\/blog.besharp.it\/it\/\",\"name\":\"Proud2beCloud Blog\",\"description\":\"il blog di beSharp\",\"alternateName\":\"Proud2beCloud Blog\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/blog.besharp.it\/it\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"it-IT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/blog.besharp.it\/it\/#\/schema\/person\/f27fc12d10867c6ea6e0158ce4dd8924\",\"name\":\"Alessandro Gaggia\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"it-IT\",\"@id\":\"https:\/\/blog.besharp.it\/it\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/f58dc28050f26409e22ab60346d06220?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/f58dc28050f26409e22ab60346d06220?s=96&d=mm&r=g\",\"caption\":\"Alessandro Gaggia\"},\"description\":\"Head of software development di beSharp, Full-Stack developer, mi occupo di garantire lo stato dell\u2019arte di tutta la nostra codebase. Scrivo codice in quasi ogni linguaggio, ma prediligo Typescript. Respiro Informatica, Game design, Cinema, Fumetti e buona cucina. Disegno per passione!\",\"url\":\"https:\/\/blog.besharp.it\/it\/author\/alessandro-gaggia\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"AWS Glue Elastic Views! Framework per ETL e Aggregazione (quasi) senza codice - Proud2beCloud Blog","description":"Abbiamo testato il servizio AWS Glue Elastic Views, annunciato allo scorso re:Invent e ancora in preview. Ecco cosa ne pensiamo!","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/","og_locale":"it_IT","og_type":"article","og_title":"AWS Glue Elastic Views! Framework per ETL e Aggregazione (quasi) senza codice","og_description":"Abbiamo testato il servizio AWS Glue Elastic Views, annunciato allo scorso re:Invent e ancora in preview. Ecco cosa ne pensiamo!","og_url":"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/","og_site_name":"Proud2beCloud Blog","article_published_time":"2021-04-16T11:59:00+00:00","article_modified_time":"2023-03-29T13:34:42+00:00","og_image":[{"url":"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/twitter-shared-link-3.png","type":"","width":"","height":""}],"author":"Alessandro Gaggia","twitter_card":"summary_large_image","twitter_title":"AWS Glue Elastic Views! Framework per ETL e Aggregazione (quasi) senza codice","twitter_description":"Abbiamo testato il servizio AWS Glue Elastic Views, annunciato allo scorso re:Invent e ancora in preview. Ecco cosa ne pensiamo!","twitter_image":"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/twitter-shared-link-3.png","twitter_misc":{"Scritto da":"Alessandro Gaggia","Tempo di lettura stimato":"17 minuti"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/","url":"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/","name":"AWS Glue Elastic Views! Framework per ETL e Aggregazione (quasi) senza codice - Proud2beCloud Blog","isPartOf":{"@id":"https:\/\/blog.besharp.it\/it\/#website"},"primaryImageOfPage":{"@id":"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/#primaryimage"},"image":{"@id":"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/#primaryimage"},"thumbnailUrl":"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/beSharp_blog_Copertine_2021_15_04_2021_15_04_2021.png","datePublished":"2021-04-16T11:59:00+00:00","dateModified":"2023-03-29T13:34:42+00:00","author":{"@id":"https:\/\/blog.besharp.it\/it\/#\/schema\/person\/f27fc12d10867c6ea6e0158ce4dd8924"},"description":"Abbiamo testato il servizio AWS Glue Elastic Views, annunciato allo scorso re:Invent e ancora in preview. Ecco cosa ne pensiamo!","breadcrumb":{"@id":"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/#breadcrumb"},"inLanguage":"it-IT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/"]}]},{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/#primaryimage","url":"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/beSharp_blog_Copertine_2021_15_04_2021_15_04_2021.png","contentUrl":"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/04\/beSharp_blog_Copertine_2021_15_04_2021_15_04_2021.png","width":1668,"height":1250,"caption":"AWS Glue Elastic Views! Framework per ETL e Aggregazione (quasi) senza codice"},{"@type":"BreadcrumbList","@id":"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/blog.besharp.it\/it\/"},{"@type":"ListItem","position":2,"name":"AWS Glue Elastic Views! Framework per ETL e Aggregazione (quasi) senza codice"}]},{"@type":"WebSite","@id":"https:\/\/blog.besharp.it\/it\/#website","url":"https:\/\/blog.besharp.it\/it\/","name":"Proud2beCloud Blog","description":"il blog di beSharp","alternateName":"Proud2beCloud Blog","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/blog.besharp.it\/it\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"it-IT"},{"@type":"Person","@id":"https:\/\/blog.besharp.it\/it\/#\/schema\/person\/f27fc12d10867c6ea6e0158ce4dd8924","name":"Alessandro Gaggia","image":{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/blog.besharp.it\/it\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/f58dc28050f26409e22ab60346d06220?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/f58dc28050f26409e22ab60346d06220?s=96&d=mm&r=g","caption":"Alessandro Gaggia"},"description":"Head of software development di beSharp, Full-Stack developer, mi occupo di garantire lo stato dell\u2019arte di tutta la nostra codebase. Scrivo codice in quasi ogni linguaggio, ma prediligo Typescript. Respiro Informatica, Game design, Cinema, Fumetti e buona cucina. Disegno per passione!","url":"https:\/\/blog.besharp.it\/it\/author\/alessandro-gaggia\/"}]}},"_links":{"self":[{"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/posts\/3013","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/comments?post=3013"}],"version-history":[{"count":0,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/posts\/3013\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/media\/3022"}],"wp:attachment":[{"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/media?parent=3013"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/categories?post=3013"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/tags?post=3013"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}