{"id":3013,"date":"2021-04-16T13:59:00","date_gmt":"2021-04-16T11:59:00","guid":{"rendered":"https:\/\/blog.besharp.it\/?p=3013"},"modified":"2023-03-29T15:34:42","modified_gmt":"2023-03-29T13:34:42","slug":"aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice","status":"publish","type":"post","link":"https:\/\/blog.besharp.it\/it\/aws-glue-elastic-views-framework-per-etl-e-aggregazione-quasi-senza-codice\/","title":{"rendered":"AWS Glue Elastic Views! Framework per ETL e Aggregazione (quasi) senza codice"},"content":{"rendered":"\n

Introduzione<\/h2>\n\n\n\n

L\u2019ETL<\/strong> rappresenta uno step fondamentale in un processo di Machine Learning in quanto \u00e8 il trampolino di lancio su cui si basa tutto il set di dati per la definizione del modello, per questo i data scientist e gli esperti MLOps pianificano attentamente i job e le pipeline per gestire l’estrazione dei dati dai database<\/strong>, spesso di natura diversa, pulendo<\/strong> e normalizzando i dati<\/strong> ed infine, generando un data lake<\/strong>per migliorare ulteriormente i dati durante il processo di indagine.<\/p>\n\n\n\n

Di solito, questo processo prevede diversi passaggi, il coordinamento della loro esecuzione, l’accesso a diversi database con diverse tecnologie, la preparazione di molti script, la conoscenza di diversi linguaggi per interrogare i dati rilevanti e cos\u00ec via.<\/p>\n\n\n\n

Prendersi cura di tutti questi passaggi \u00e8 un compito ardito e richiede molta esperienza e, naturalmente, tempo, minando l’efficienza dell’intero progetto che si deve gestire.<\/p>\n\n\n\n

AWS, che sta progredendo molto rapidamente negli ultimi due anni nello sviluppo di strumenti e servizi per aiutare nelle attivit\u00e0 di machine learning<\/strong>, questa volta ci porta un altro importante servizio in soccorso: AWS Elastic Views<\/strong>. <\/p>\n\n\n\n

AWS Elastic Views consente a un utente di richiedere dati da diverse fonti in modo completamente indipendente dalla loro natura, di eseguire query per i dati in un linguaggio compatibile con SQL e di inviare tutti i dati interrogati a una destinazione, tipicamente S3 o un’altra destinazione dati, ed infine a produrre un data lake con cui lavorare.<\/strong><\/p>\n\n\n

\n
\"AWS<\/figure><\/div>\n\n\n

Alcuni dei principali vantaggi sono: <\/p>\n\n\n\n