{"id":3591,"date":"2021-10-01T13:59:00","date_gmt":"2021-10-01T11:59:00","guid":{"rendered":"https:\/\/blog.besharp.it\/?p=3591"},"modified":"2021-10-01T14:32:21","modified_gmt":"2021-10-01T12:32:21","slug":"mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws","status":"publish","type":"post","link":"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/","title":{"rendered":"MLOps essentials: quattro principi fondamentali per il Machine Learning Operations su AWS"},"content":{"rendered":"\n<p>Quando affrontiamo i moderni problemi di Machine Learning in un ambiente AWS, c&#8217;\u00e8 molto pi\u00f9 che la tradizionale preparazione dei dati, l&#8217;addestramento del modello e le inferenze finali da considerare. Inoltre, la pura potenza di calcolo non \u00e8 l&#8217;unica preoccupazione di cui dobbiamo occuparci nella creazione di una soluzione ML.<\/p>\n\n\n\n<p>Esiste una<strong> differenza sostanziale tra la creazione e il test di un modello di Machine Learning<\/strong> all&#8217;interno di un notebook Jupyter in locale e il rilascio su un&#8217;infrastruttura di produzione in grado di generare valore aziendale.<\/p>\n\n\n\n<p>Le complessit\u00e0 legate all&#8217;implementazione di un flusso di lavoro di Machine Learning nel Cloud sono chiamate <a href=\"https:\/\/ml-ops.org\/content\/motivation#deployment-gap\">gap di distribuzione<\/a> e vedremo insieme in questo articolo come affrontarlo combinando velocit\u00e0 e agilit\u00e0 nella modellazione e formazione, con i criteri di solidit\u00e0, scalabilit\u00e0 e resilienza richiesti da ambienti di produzione.<\/p>\n\n\n\n<p>La procedura in cui ci addentreremo \u00e8 simile per molti aspetti al modello DevOps per lo sviluppo software &#8220;tradizionale&#8221;, e il paradigma MLOps, cos\u00ec chiamato, viene comunemente proposto come &#8220;<a href=\"https:\/\/ml-ops.org\/content\/motivation#mlops-definition\">un processo end-to-end per progettare, creare e gestire applicazioni di Machine Learning in modo riproducibile, testabile ed evolutivo<\/a>&#8220;.<\/p>\n\n\n\n<p>Per questo motivo, man mano che ci addentreremo nei paragrafi seguenti, approfondiremo le ragioni e i principi alla base del paradigma MLOps e come si collega facilmente all&#8217;ecosistema AWS e alle migliori pratiche dell\u2019 AWS Well-Architected Framework.<\/p>\n\n\n\n<p>Allora, iniziamo!<\/p>\n\n\n\n<h1 class=\"wp-block-heading\">Perch\u00e8 abbiamo bisogno del MLOps?<\/h1>\n\n\n\n<p>Come detto prima, i carichi di lavoro di Machine Learning possono essere visti essenzialmente come pezzi complessi di software, quindi possiamo ancora applicare pratiche software &#8220;tradizionali&#8221;. Tuttavia, per la sua natura sperimentale, il Machine Learning mette in gioco alcune <strong>differenze essenziali<\/strong>, che richiedono un paradigma di gestione del ciclo di vita fatto su misura per le loro esigenze.<\/p>\n\n\n\n<p>Queste differenze si presentano in tutte le varie fasi di un carico di lavoro e contribuiscono in modo significativo al divario di distribuzione di cui abbiamo parlato, quindi una descrizione generale \u00e8, quantomeno, d\u2019obbligo:<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Codice<\/h3>\n\n\n\n<p>Gestire codice nelle appliance di Machine Learning \u00e8 una questione complessa. Vediamo perch\u00e9!<\/p>\n\n\n\n<p>La collaborazione sugli <strong>esperimenti del modello tra i data scientist<\/strong> non \u00e8 facile come la condivisione di file di codice tradizionali: i notebook Jupyter consentono di scrivere ed eseguire codice, rendendo le operazioni git pi\u00f9 complesse per mantenere il codice sincronizzato tra gli utenti, con <strong>frequenti conflitti di merge<\/strong>.<\/p>\n\n\n\n<p>Gli sviluppatori devono scrivere codice per diversi sottoprogetti: <strong>processi ETL<\/strong>, <strong>logica del modello<\/strong>, <strong>training e convalida<\/strong>, <strong>logica di inferenza<\/strong> e <strong>modelli di Infrastructure-as-Code<\/strong>. Tutti questi progetti separati devono essere gestiti centralmente e adeguatamente versionati!<\/p>\n\n\n\n<p>Per le moderne applicazioni software, esistono molte procedure <strong>consolidate di controllo di versione<\/strong> come il <a href=\"https:\/\/www.conventionalcommits.org\/en\/v1.0.0\/\">commit convenzionale<\/a>, il branching delle funzionalit\u00e0, lo <a href=\"https:\/\/medium.com\/@slamflipstrom\/a-beginners-guide-to-squashing-commits-with-git-rebase-8185cf6e62ec\">squash e rebase<\/a> e l&#8217;<a href=\"https:\/\/martinfowler.com\/articles\/branching-patterns.html\">integrazione continua<\/a>.<\/p>\n\n\n\n<p>Queste tecniche, tuttavia, non sono sempre applicabili ai notebook Jupyter poich\u00e9, come affermato in precedenza, non sono semplici file di testo.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Sviluppo<\/h3>\n\n\n\n<p>I data scientists devono effettuare molte combinazioni di set di dati, funzionalit\u00e0, tecniche di modellazione, algoritmi e configurazioni di parametri per trovare la <strong>soluzione che estrae al meglio il valore aziendale<\/strong>.<\/p>\n\n\n\n<p>Il punto chiave \u00e8 trovare un sistema per tenere traccia di esperimenti <strong>riusciti<\/strong> e <strong>falliti<\/strong> mantenendo la <strong>riproducibilit\u00e0<\/strong> e la <strong>riutilizzabilit\u00e0<\/strong> <strong>del<\/strong> <strong>codice<\/strong>. Perseguire questo obiettivo significa disporre di strumenti che consentano rapidi rollback e un monitoraggio efficiente dei risultati, meglio se con strumenti visivi.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Test<\/h3>\n\n\n\n<p>Testare un carico di lavoro di Machine Learning \u00e8 <strong>pi\u00f9 complesso<\/strong> rispetto al test di software tradizionali.<\/p>\n\n\n\n<p>Il set di dati richiede una <strong>convalida continua<\/strong>. I modelli sviluppati dai data scientist<strong> richiedono una valutazione continua della qualit\u00e0<\/strong>, la convalida del training e <strong>controlli delle prestazioni<\/strong>.<\/p>\n\n\n\n<p>Tutti questi controlli si aggiungono ai tipici test di unit\u00e0 e integrazione, definendo il concetto di <strong>Training Continuo<\/strong>, necessario per evitare l&#8217;<strong>invecchiamento del modello<\/strong> e il <a href=\"https:\/\/www-ai.cs.tu-dortmund.de\/LEHRE\/FACHPROJEKT\/SS12\/paper\/concept-drift\/tsymbal2004.pdf\">concept drift<\/a>.<\/p>\n\n\n\n<p>Esclusivo dei flussi di lavoro di Machine Learning, il suo scopo \u00e8 di attivare il retraining e servire automaticamente i modelli.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Rilascio in produzione<\/h3>\n\n\n\n<p>La distribuzione di modelli di Machine Learning nel cloud \u00e8 un <strong>compito impegnativo<\/strong>. In genere richiede la creazione di varie <strong>pipeline a pi\u00f9 passaggi<\/strong> che servono per riaddestrare e distribuire automaticamente i modelli.<\/p>\n\n\n\n<p>Questo approccio aggiunge complessit\u00e0 alla soluzione e richiede l&#8217;<strong>automazione di passaggi eseguiti manualmente dai data scientist<\/strong> durante il training e la convalida di nuovi modelli nella fase sperimentale di un progetto.<\/p>\n\n\n\n<p>\u00c8 fondamentale creare procedure di retraining efficienti!<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Monitoraggio in Produzione<\/h3>\n\n\n\n<p>I modelli di Machine Learning tendono a <strong>decadere molto pi\u00f9 velocemente rispetto al software &#8220;tradizionale&#8221;<\/strong>. Possono avere prestazioni ridotte a causa di codice non ottimale, <strong>scelte hardware errate<\/strong> nelle fasi di addestramento e inferenza e set di dati in evoluzione.<\/p>\n\n\n\n<p>Una metodologia adeguata deve tenere conto di questo degrado; pertanto, abbiamo bisogno di un <strong>meccanismo di tracciamento<\/strong> per <strong>riepilogare efficacemente le statistiche di un carico di lavoro<\/strong>, monitorare le <strong>prestazioni<\/strong> e <strong>inviare notifiche di allarme<\/strong>.<\/p>\n\n\n\n<p>Tutte queste procedure devono essere automatizzate e sono chiamate <strong>Monitoraggio Continuo<\/strong>, che ha anche l&#8217;ulteriore vantaggio di abilitare il Training Continuo, mediante la misurazione di soglie significative.<\/p>\n\n\n\n<p>Vogliamo anche <strong>applicare i rollback<\/strong> quando un&#8217;inferenza del modello devia dalle soglie di punteggio selezionate il pi\u00f9 rapidamente possibile per provare nuove combinazioni di funzionalit\u00e0.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Continuous Integration e Continuous Deployment<\/h3>\n\n\n\n<p>Il Machine Learning condivide approcci simili alle pipeline di CI\/CD standard delle moderne applicazioni software: controllo del codice sorgente, test di unit\u00e0, test di integrazione, delivery continuo dei pacchetti applicativi.<\/p>\n\n\n\n<p>Tuttavia,<strong> modelli e data set richiedono interventi particolari<\/strong>.<\/p>\n\n\n\n<p>L&#8217;integrazione continua ora richiede, come detto prima, anche il test e la convalida dei dati, schemi di dati e modelli.<\/p>\n\n\n\n<p>In questo contesto, la distribuzione continua deve essere progettata come una pipeline di training ML <strong>in grado di distribuire automaticamente l&#8217;inferenza come servizio raggiungibile dal web<\/strong>.<\/p>\n\n\n\n<p>Come si pu\u00f2 intuire, c&#8217;\u00e8 molta carne al fuoco che rende la strutturazione di un progetto di Machine Learning un compito assai complesso.<\/p>\n\n\n\n<p>Prima di introdurre il lettore alla metodologia MLOps, che pone sotto la sua ala tutti questi aspetti cruciali, vedremo come \u00e8 strutturato un tipico workflow di Machine Learning, tenendo conto di quanto detto fino ad ora.<\/p>\n\n\n\n<p>Proseguiamo insieme!<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Un tipico flusso di Machine Learning in Cloud<\/h2>\n\n\n\n<p><\/p>\n\n\n\n<div class=\"wp-block-image\"><figure class=\"aligncenter size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"529\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image2-1-1024x529.png\" alt=\"A typical Machine Learning workflow in the Cloud\" class=\"wp-image-3579\" srcset=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image2-1-1024x529.png 1024w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image2-1-400x207.png 400w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image2-1-768x397.png 768w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image2-1-1536x794.png 1536w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image2-1.png 1999w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption>Courtesy of https:\/\/ml-ops.org\/content\/end-to-end-ml-workflow<\/figcaption><\/figure><\/div>\n\n\n\n<p>Un flusso di lavoro di Machine Learning non \u00e8 pensato per essere lineare, proprio come il software tradizionale. \u00c8 composto principalmente da tre livelli distinti: <strong>dati<\/strong>, <strong>modello<\/strong> e <strong>codice<\/strong> e ognuno <strong>fornir\u00e0 e recuperer\u00e0 continuamente feedback dagli altri<\/strong>.<\/p>\n\n\n\n<p>Quindi, mentre con il software tradizionale, possiamo dire che ogni passaggio che compone un flusso di lavoro pu\u00f2 essere atomico e in qualche modo isolato, nel Machine Learning, questo non \u00e8 del tutto vero <strong>poich\u00e9 i livelli sono profondamente interconnessi<\/strong>.<\/p>\n\n\n\n<p>Un tipico esempio \u00e8 quando le modifiche al set di dati richiedono il retraining o il ripensamento di un modello. Anche un modello diverso, di solito, necessita di modifiche al codice che lo esegue.<\/p>\n\n\n\n<p>Vediamo insieme da cosa \u00e8 composto ogni Layer e come funziona.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Strato di dati<\/h3>\n\n\n\n<p>Il livello dati comprende tutte le attivit\u00e0 necessarie per manipolare i dati e renderli disponibili per la progettazione e l&#8217;addestramento del modello: <strong>acquisizione dei dati<\/strong>, <strong>ispezione<\/strong>, <strong>pulizia<\/strong> e, infine, <strong>preelaborazione dei dati<\/strong>.<\/p>\n\n\n\n<p>I set di Dati per problemi reali, o quantomeno realistici, possono essere nell\u2019ordine di GB o addirittura TB, in continuo aumento, quindi abbiamo bisogno di uno spazio di archiviazione adeguato per gestire enormi data lake.<\/p>\n\n\n\n<p>Lo storage deve essere robusto, consentire un&#8217;elaborazione parallela efficiente e integrarsi facilmente con gli strumenti per i lavori <a href=\"https:\/\/en.wikipedia.org\/wiki\/Extract,_transform,_load\">ETL<\/a>.<\/p>\n\n\n\n<p>Questo livello \u00e8 il pi\u00f9 cruciale, rappresentando l&#8217;<a href=\"https:\/\/towardsdatascience.com\/workflow-of-a-machine-learning-project-ec1dba419b94#:~:text=In%20machine%20learning%2C%20there%20is,to%20actually%20perform%20the%20analysis.\">80% del lavoro svolto in un flusso di lavoro di Machine Learning<\/a>; due famose citazioni confermano questo fatto: &#8220;<em>garbage in, garbage out<\/em>&#8221; e &#8220;<em>il tuo modello \u00e8 valido solo quanto i tuoi dati<\/em>&#8220;.<\/p>\n\n\n\n<p>La maggior parte di questi concetti sono prerogativa <strong>delle buone pratiche di Data Analytics<\/strong>, profondamente intrecciata con il Machine Learning, e li analizzeremo in dettaglio pi\u00f9 avanti in questo articolo.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Strato di modello<\/h3>\n\n\n\n<p>Il livello di Modello contiene tutte le operazioni per <strong>progettare<\/strong>, <strong>sperimentare<\/strong>, <strong>addestrare<\/strong> e <strong>convalidare<\/strong> uno o pi\u00f9 modelli di Machine Learning. I professionisti del machine learning conducono prove sui dati in questo livello, sperimentano algoritmi su <strong>diverse soluzioni hardware<\/strong> ed eseguono l&#8217;<strong>ottimizzazione degli iperparametri<\/strong>.<\/p>\n\n\n\n<p>Questo livello \u00e8 tipicamente <strong>soggetto a frequenti modifiche dovute ad aggiornamenti sia di Dati che di Codice<\/strong>, necessari per evitare il <strong>concept drift<\/strong>. Per gestire correttamente il suo ciclo di vita su larga scala, dobbiamo definire <strong>procedure automatiche<\/strong> per il retraining e la convalida.<\/p>\n\n\n\n<p>Il livello di Modello \u00e8 anche una fase in cui si verificano frequenti discussioni, tra Data Scientist e parti interessate, sulla convalida del modello, sulla solidit\u00e0 concettuale e sulle discordanze rispetto ai risultati attesi.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Strato di codice<\/h3>\n\n\n\n<p>Nel livello Codice, definiamo un insieme di procedure per mettere in produzione un modello, gestire le <strong>richieste di inferenze<\/strong>, archiviare i metadati di un modello, analizzare<strong> le prestazioni complessive<\/strong>, <strong>monitorare il flusso di lavoro<\/strong> (debug, logging, auditing) e <strong>orchestrare automatismi di CI\/CD\/CT\/CM<\/strong>.<\/p>\n\n\n\n<p>Un buon livello Codice consente un <strong>modello di feedback continuo<\/strong>, in cui il modello si evolve nel tempo, tenendo conto dei risultati delle inferenze in corso.<\/p>\n\n\n\n<p>Tutti e tre questi livelli sono gestiti da &#8220;sub-pipeline&#8221;, che si sommano tra loro per formare una &#8220;macro-pipeline&#8221; nota come <a href=\"https:\/\/towardsdatascience.com\/architecting-a-machine-learning-pipeline-a847f094d1c7\">Machine Learning Pipeline<\/a>.<\/p>\n\n\n\n<p>Progettare, costruire ed eseguire automaticamente questa pipeline, riducendo il deployment gap nel processo, \u00e8 il nucleo del paradigma MLOps.<\/p>\n\n\n\n<h1 class=\"wp-block-heading\">MLOps con AWS: i quattro pilastri<\/h1>\n\n\n\n<p>Il paradigma MLOps mira a rendere lo sviluppo e il mantenimento dei flussi di lavoro di Machine Learning <strong>semplici<\/strong> ed <strong>efficienti<\/strong>. La comunit\u00e0 di data science generalmente concorda sul fatto che non si tratta di un&#8217;unica soluzione tecnica, ma di una serie di best practice e principi guida sull&#8217;apprendimento automatico.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"630\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image3-1-1024x630.png\" alt=\"MLOps on AWS: the four pillars\" class=\"wp-image-3581\" srcset=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image3-1-1024x630.png 1024w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image3-1-400x246.png 400w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image3-1-768x472.png 768w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image3-1-1536x944.png 1536w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image3-1.png 1999w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption>Courtesy of https:\/\/valohai.com\/mlops\/<\/figcaption><\/figure>\n\n\n\n<p><\/p>\n\n\n\n<p>Un approccio MLOps coinvolge operazioni, tecniche e strumenti, che possiamo raggruppare in <strong>quattro pilastri principali<\/strong>: <strong>Collaborazione<\/strong>, <strong>Riproducibilit\u00e0<\/strong>, <strong>Continuit\u00e0<\/strong> e <strong>Monitoraggio<\/strong>.<\/p>\n\n\n\n<p>Ci concentreremo ora su ciascuno di essi, fornendo molteplici esempi pratici che mostrano come AWS, con molti dei suoi servizi, pu\u00f2 essere uno strumento prezioso per sviluppare soluzioni che aderiscono alle best practice del paradigma.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Collaborazione<\/h3>\n\n\n\n<p>Un buon flusso di lavoro di Machine Learning dovrebbe essere <strong>collaborativo<\/strong> e la collaborazione si dovrebbe verificare su tutte le pipeline ML.<\/p>\n\n\n\n<p>A partire dal Data Layer, abbiamo bisogno di <strong>un&#8217;infrastruttura condivisa<\/strong>, il che significa un <strong>data lake distribuito<\/strong>. AWS offre diverse soluzioni di storage per questo scopo, come <strong>Amazon Redshift<\/strong>, il pi\u00f9 adatto per il Data Warehousing, o <strong>Amazon FSx per Lustre<\/strong>, perfetto come file system distribuito. Tuttavia, il servizio pi\u00f9 comunemente utilizzato per la creazione di data lake \u00e8 <strong>Amazon S3<\/strong>.<\/p>\n\n\n\n<p>Per mantenere correttamente un data lake, dobbiamo effettuare regolarmente l\u2019ingestion di dati da diverse fonti e gestire l&#8217;accesso condiviso tra i vari collaboratori, assicurandoci che i dati <strong>siano sempre aggiornati<\/strong>.<\/p>\n\n\n\n<p>Sicuramente non un compito facile e per questo possiamo sfruttare <strong>S3 LakeFormation<\/strong>, un servizio gestito che aiuta a creare e mantenere un data lake, incapsulando <strong>AWS Glue<\/strong> e <strong>Glue Studio<\/strong>, in particolare semplificando il set-up dei Crawler di Glue e la loro manutenzione.<\/p>\n\n\n\n<p>S3 LakeFormation pu\u00f2 anche occuparsi dei dati e delle regole di autorizzazione dei collaboratori, gestendo utenti e ruoli nel <strong>catalogo di AWS Glue<\/strong>. Questa funzionalit\u00e0 \u00e8 fondamentale, in quanto collaborazione significa anche <a href=\"https:\/\/blog.besharp.it\/costruire-un-data-lake-su-aws-con-aws-lake-formation\/\">mantenere la governance sul data lake<\/a>, evitando manipolazioni involontarie dei dati, consentendo o negando l&#8217;accesso a risorse specifiche all&#8217;interno di un catalogo.<\/p>\n\n\n\n<p>Per il livello del Modello, i Data Scientist hanno bisogno di uno <strong>strumento per la progettazione collaborativa e la codifica dei modelli di Machine Learning<\/strong>. Deve consentire a <strong>pi\u00f9 utenti di lavorare sullo stesso esperimento<\/strong>, mostrare rapidamente i risultati di ciascun collaboratore, garantire la <strong>programmazione in coppia in tempo reale<\/strong> ed evitare il pi\u00f9 possibile regressioni del codice e <strong>conflitti di merge<\/strong>.<\/p>\n\n\n\n<p><strong>SageMaker<\/strong> \u00e8 il framework all-in-one opinionato per il Machine Learning su AWS e <strong>Amazon SageMaker Studio<\/strong> \u00e8 un IDE specializzato sviluppato esplicitamente per lavorare con i notebook Jupyter <a href=\"https:\/\/blog.besharp.it\/a-clustering-process-with-sagemaker-experiments-a-real-world-use-case\/\">pensando alla collaborazione<\/a>.<\/p>\n\n\n\n<p>SageMaker Studio permette di <strong>condividere un&#8217;istanza EC2 dedicata<\/strong> tra diversi utenti registrati, in cui \u00e8 possibile salvare tutti gli esperimenti fatti durante lo sviluppo di un modello di Machine Learning. Questa istanza pu\u00f2 ospitare direttamente i notebook Jupyter o ricevere risultati, allegati e grafica tramite API da altre istanze Notebook.<\/p>\n\n\n\n<p>SageMaker Studio \u00e8 inoltre direttamente integrato con <strong>SageMaker Experiments<\/strong> e <strong>SageMaker Feature Store<\/strong>.<\/p>\n\n\n\n<p>Il primo \u00e8 un set di API che consente ai Data Scientist di registrare e archiviare un esperimento sul modello, <strong>dall&#8217;ottimizzazione<\/strong> alla <strong>convalida<\/strong>, e riportare i risultati nella console dell\u2019IDE. Il secondo \u00e8 uno <strong>store gestito da AWS, appositamente creato per la condivisione di parametri aggiornati su diverse prove dei modelli<\/strong>.<\/p>\n\n\n\n<p>SageMaker Feature Store rappresenta un notevole passo avanti nel mantenimento della governance sui parametri dei dati tra diversi team, principalmente perch\u00e9 evita un comportamento tipico, ma improprio, <strong>di avere set di parametri diversi<\/strong> per l&#8217;addestramento e l&#8217;inferenza. \u00c8 anche una soluzione perfetta per garantire che ogni Data Scientist che lavora su un progetto abbia una <strong>visibilit\u00e0 completa dell&#8217;etichettatura dei parametri<\/strong>.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Riproducibilit\u00e0<\/h3>\n\n\n\n<p>Per essere robusto, tollerante ai guasti e corretamente scalabile, proprio come le applicazioni software &#8220;tradizionali&#8221;, un flusso di lavoro di Machine Learning deve essere <strong>riproducibile<\/strong>.<\/p>\n\n\n\n<p>Un punto cruciale che dobbiamo affrontare con attenzione, come abbiamo detto prima, \u00e8 il <strong>Controllo di Versione<\/strong>: dobbiamo garantire che codice, dati, metadati del modello e funzionalit\u00e0 siano adeguatamente versionati.<\/p>\n\n\n\n<p>Per i notebook Jupyter, Git o <strong>AWS CodeCommit<\/strong> sono scelte naturali, ma la gestione delle informazioni di diversi esperimenti, in particolare dei metadati del modello, richiede alcune considerazioni particolari.<\/p>\n\n\n\n<p>Possiamo utilizzare SageMaker Feature Store per metadati e funzionalit\u00e0. Ci consente di archiviare i dati direttamente online in uno store gestito o di integrarci con <strong>AWS Glue<\/strong> (e S3 LakeFomation). Consente inoltre la crittografia dei dati utilizzando <strong>AWS KMS<\/strong> e pu\u00f2 essere controllato tramite API o all&#8217;interno di SageMaker Studio.<\/p>\n\n\n\n<p>Se si vuole che un flusso di lavoro sia riproducibile, si intende sperimentare <strong>su larga scala<\/strong>, anche in parallelo, in modo rapido, prevedibile e automatico.<\/p>\n\n\n\n<p>SageMaker offre diversi modi per combinare e abbinare diversi algoritmi di Machine Learning e AWS permette tre possibili approcci per l&#8217;esecuzione di un modello.<\/p>\n\n\n\n<p><strong>Managed Algorithm<\/strong>: SageMaker offre fino a 13 algoritmi gestiti per scenari ML comuni e, per ognuno, una documentazione dettagliata descrive le specifiche software e hardware.<\/p>\n\n\n\n<p><a href=\"https:\/\/blog.besharp.it\/iot-ingestion-and-ml-analytics-pipeline-with-aws-iot-kinesis-and-sagemaker\/\"><strong>Bring your own algorithm<\/strong><\/a>: i Data Scientist possono introdurre rapidamente logica personalizzata sui notebook, a condizione che il modello rispetti i requisiti di <strong>SageMaker fit()<\/strong>.<\/p>\n\n\n\n<p><a href=\"https:\/\/blog.besharp.it\/en\/a-clustering-process-with-sagemaker-experiments-a-real-world-use-case\/\"><strong>Bring your own Container<\/strong><\/a>: modelli particolari come <a href=\"https:\/\/scikit-learn.org\/stable\/modules\/generated\/sklearn.cluster.DBSCAN.html\">DBScan<\/a> richiedono Kernel personalizzati per eseguire l&#8217;algoritmo, quindi SageMaker consente di registrare un container personalizzato con un Kernel speciale e il codice per l&#8217;esecuzione del modello.<\/p>\n\n\n\n<p>I Data Scientist possono affrontare tutti questi approcci insieme.<\/p>\n\n\n\n<p>SageMaker offre la possibilit\u00e0 di definire l&#8217;hardware su cui eseguire il training o la convalida del modello selezionando il <strong>tipo di istanza<\/strong> e la <strong>dimensione di quest\u2019ultima<\/strong> nelle propriet\u00e0 del modello, il che \u00e8 estremamente importante in quanto algoritmi diversi richiedono macchine ottimizzate per CPU o GPU.<\/p>\n\n\n\n<p>Per mettere a punto un modello, SageMaker pu\u00f2 eseguire diverse strategie di <strong>ottimizzazione degli iperparametri<\/strong>: <strong>Ricerca Casuale<\/strong> e <strong>Ricerca Bayesiana<\/strong>. Queste due strategie sono completamente automatiche, garantendo un modo per testare un numero pi\u00f9 significativo di combinazioni di prove in una frazione di tempo normalmente necessario.<\/p>\n\n\n\n<p>Per migliorare la ripetibilit\u00e0 degli esperimenti, dobbiamo anche gestire diversi modi di eseguire la preelaborazione dei dati (diversi set di dati applicati allo stesso modello). Per questo, abbiamo <strong>AWS Data Wrangler<\/strong>, che contiene oltre <strong>300 trasformazioni di dati integrate<\/strong> per normalizzare, trasformare e combinare rapidamente potenziali feature senza dover scrivere alcun codice.<\/p>\n\n\n\n<p>AWS Data Wrangler pu\u00f2 essere una buona scelta quando il problema di ML che si sta affrontando \u00e8 in qualche modo standardizzato, ma nella maggior parte dei casi i set di dati sono estremamente diversi, il che significa affrontare i lavori di ETL personalmente.<\/p>\n\n\n\n<p>Per i lavori ETL personalizzati, AWS Glue \u00e8 ancora la scelta giusta, poich\u00e9 consente anche di salvare i crawler di lavoro e i cataloghi di Glue (per la ripetibilit\u00e0). Insieme ad AWS Glue e AWS Glue Studio, abbiamo anche provato <strong>AWS Glue Elastic Views<\/strong>, un nuovo servizio che aiuta a <a href=\"https:\/\/blog.besharp.it\/aws-glue-elastic-views-an-almost-no-code-etl-and-aggregation-framework\/\">gestire diverse origini dati insieme<\/a>.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Continuit\u00e0<\/h3>\n\n\n\n<p>Per rendere <strong>continuo<\/strong> il nostro flusso di lavoro di Machine Learning, dobbiamo utilizzare il pi\u00f9 possibile l&#8217;<strong>automazione delle pipeline<\/strong> per gestirne l&#8217;intero ciclo di vita.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"768\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image1-2-1024x768.png\" alt=\"ML Pipeline\" class=\"wp-image-3583\" srcset=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image1-2-1024x768.png 1024w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image1-2-400x300.png 400w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image1-2-768x576.png 768w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image1-2-1536x1152.png 1536w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/image1-2.png 1999w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption>Courtesy of https:\/\/ml-ops.org\/content\/three-levels-of-ml-software<\/figcaption><\/figure>\n\n\n\n<p><\/p>\n\n\n\n<p>Possiamo suddividere l&#8217;intero flusso di lavoro ML in tre pipeline significative, una per ogni livello di Machine Learning.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Pipeline di Data engineering<\/h4>\n\n\n\n<p>La pipeline dei dati \u00e8 composta dalle fasi di <strong>Acquisizione<\/strong>, <strong>Esplorazione<\/strong>, <strong>Convalida<\/strong>, <strong>Pulizia<\/strong> e <strong>Suddivisione<\/strong>.<\/p>\n\n\n\n<p>La fase di Acquisizione su AWS in genere significa portare i dati grezzi su S3, utilizzando qualsiasi strumento e tecnologia disponibile: accesso diretto all&#8217;API, crawler Lambda personalizzati, <strong>S3 LakeFormation<\/strong> o <strong>Amazon Kinesis Firehose<\/strong>.<\/p>\n\n\n\n<p>Poi abbiamo una fase <a href=\"https:\/\/blog.besharp.it\/orchestrating-etl-pipelines-on-aws-with-glue-stepfunctions-and-cloudformation\/\">ETL di pre-elaborazione<\/a>, che \u00e8 <strong>sempre richiesta<\/strong>!<\/p>\n\n\n\n<p><strong>AWS Glue <\/strong>\u00e8 il pi\u00f9 versatile tra tutti gli strumenti disponibili per i processi di ETL, in quanto consente di leggere e aggregare informazioni da tutti i servizi precedenti utilizzando i <strong>Glue Crawlers<\/strong>. Queste routine possono eseguire il polling da divers datasource per ottenere nuovi dati.<\/p>\n\n\n\n<p>Possiamo gestire le fasi di Esplorazione, Convalida e Pulizia creando script personalizzati in un linguaggio a scelta (ad es. Python) o utilizzando Jupyter Notebook, entrambi orchestrati tramite <a href=\"https:\/\/blog.besharp.it\/orchestrating-data-analytics-and-business-intelligence-pipelines-via-step-function\/\"><strong>AWS Step Functions<\/strong><\/a>.<\/p>\n\n\n\n<p><strong>AWS Data Wrangler<\/strong> rappresenta un&#8217;altra soluzione praticabile, in quanto pu\u00f2 occuparsi automaticamente di tutti i passaggi e connettersi direttamente a <strong>Amazon SageMaker Pipelines<\/strong>.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Pipeline di Modello<\/h4>\n\n\n\n<p>La pipeline del Modello \u00e8 costituita da fasi di <strong>Training<\/strong>, <strong>Valutazione<\/strong>, <strong>Test<\/strong> e <strong>Packaging<\/strong>.<\/p>\n\n\n\n<p>Queste fasi possono essere gestite direttamente dai file di Jupyter Notebook e integrate in una pipeline utilizzando <strong>AWS StepFunctions SageMaker SDK<\/strong>, che consente di chiamare le funzioni SageMaker all&#8217;interno di uno script StepFunction.<\/p>\n\n\n\n<p>Questo exploit offre estrema flessibilit\u00e0 in quanto permette di:<\/p>\n\n\n\n<ol class=\"wp-block-list\"><li><strong>Avviare rapidamente i lavori di training di SageMaker<\/strong> con tutti i parametri configurati.<\/li><li><strong>Valutare i modelli <\/strong>utilizzando i <strong>punteggi di valutazione precompilati<\/strong> di SageMaker.<\/li><li><strong>Eseguire pi\u00f9 test automatizzati<\/strong> direttamente dal codice.<\/li><li><strong>Registrare<\/strong> tutti i passaggi in Esperimenti di SageMaker.<\/li><\/ol>\n\n\n\n<p>Avere la logica di questa pipeline sui Notebook Jupyter ha l&#8217;ulteriore vantaggio di <strong>avere tutto sotto controllo di versione<\/strong> e <strong>facilmente testabile<\/strong>.<\/p>\n\n\n\n<p>Il packaging pu\u00f2 essere gestito tramite le <strong>API di Elastic Container Registry<\/strong>, direttamente da un Notebook Jupyter o da uno script esterno.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Pipeline di rilascio<\/h4>\n\n\n\n<p>La pipeline di distribuzione esegue la parte di <strong>CI\/CD<\/strong> ed \u00e8 responsabile della messa online dei modelli durante le fasi di <strong>Training<\/strong>, <strong>Test<\/strong> e <strong>Produzione<\/strong>. Un aspetto chiave durante questa pipeline \u00e8 che la domanda di risorse computazionali \u00e8 diversa per tutte e tre le fasi e cambia nel tempo.<\/p>\n\n\n\n<p>Ad esempio, il training all&#8217;inizio richieder\u00e0 pi\u00f9 risorse rispetto ai test e alla produzione, ma in seguito, con l&#8217;aumentare della domanda di inferenze, i requisiti di produzione saranno pi\u00f9 elevati (<strong>Distribuzione Dinamica<\/strong>).<\/p>\n\n\n\n<p>Possiamo applicare strategie di deploy avanzate tipiche dello sviluppo software &#8220;tradizionale&#8221; per affrontare i flussi di lavoro ML, inclusi test A\/B, implementazioni canary e implementazioni blue\/green.<\/p>\n\n\n\n<p>Ogni aspetto della distribuzione pu\u00f2 trarre vantaggio dalle tecniche di <a href=\"https:\/\/blog.besharp.it\/how-to-create-and-maintain-an-aws-serverless-infrastructure-with-troposphere-and-codepipeline\/\">Infrastructure as Code<\/a> e da <a href=\"https:\/\/blog.besharp.it\/how-to-setup-a-continuous-deployment-pipeline-on-aws-for-ecs-blue-green-deployments\/\">una combinazione di servizi AWS come AWS CodePipeline, CloudFormation e AWS StepFunctions<\/a>.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Monitoraggio<\/h3>\n\n\n\n<p>Infine, i flussi di lavoro di Machine Learning ben fatti devono essere <strong>monitorabili<\/strong> e il monitoraggio avviene in varie fasi.<\/p>\n\n\n\n<p>Abbiamo il <strong>monitoraggio delle prestazioni<\/strong>, che permette di capire come si comporta un modello nel tempo. Avendo continuamente feedback basati su nuove inferenze, possiamo evitare l&#8217;invecchiamento del modello (<strong>overfitting<\/strong>) e il <strong>concept drift<\/strong>.<\/p>\n\n\n\n<p><strong>SageMaker Model Monitor<\/strong> fornisce un ottimo aiuto durante questa fase in quanto pu\u00f2 eseguire il monitoraggio in tempo reale, rilevando bias e divergenze mediante tecniche di <strong>Anomaly Detection<\/strong> e inviando avvisi per applicare rimedi immediati.<\/p>\n\n\n\n<p>Quando un modello inizia a performare al di sotto della soglia predefinita, la nostra pipeline inizier\u00e0 un processo di riaddestramento con un set di dati aumentato, costituito da nuove informazioni provenienti da previsioni, diverse <strong>combinazioni di iperparametri<\/strong> o applicando il <strong>re-labeling<\/strong> sulle feature del set di dati.<\/p>\n\n\n\n<p><strong>SageMaker Clarify<\/strong> \u00e8 un altro servizio che possiamo sfruttare nel processo di monitoraggio. Rileva potenziali bias durante la preparazione dei dati, l&#8217;addestramento del modello e la produzione per le feature pi\u00f9 critiche selezionate nel set di dati.<\/p>\n\n\n\n<p>Ad esempio, pu\u00f2 verificare la presenza di divergenze legate all&#8217;et\u00e0 nel set di dati iniziale o in un modello addestrato e generare report dettagliati che quantificano diversi tipi di possibili bias. SageMaker Clarify include anche <strong>grafici di importanza delle funzioni per spiegare le previsioni del modello<\/strong>.<\/p>\n\n\n\n<p>Il debug di un modello di Machine Learning, come possiamo vedere, \u00e8 un processo lungo, complesso e costoso! C&#8217;\u00e8 un altro utile servizio di AWS: <strong>SageMaker Debugger<\/strong>; esso <strong>acquisisce le metriche di addestramento in tempo reale<\/strong>, come la perdita di dati durante la regressione, e invia avvisi quando vengono rilevate anomalie.<\/p>\n\n\n\n<p>SageMaker Debugger \u00e8 ottimo per correggere immediatamente eventuali previsioni errate del modello.<\/p>\n\n\n\n<p>Il logging su AWS pu\u00f2 essere gestito sulla totalit\u00e0 della Pipeline utilizzando Amazon CloudWatch, disponibile con tutti i servizi presentati. Cloudwatch pu\u00f2 essere ulteriormente migliorato utilizzando <a href=\"https:\/\/blog.besharp.it\/logging-best-practices-on-aws-from-an-elk-to-an-ekk-stack\/\"><strong>Kibana tramite ElasticSearch<\/strong><\/a> per avere un modo semplice per esplorare i dati di log.<\/p>\n\n\n\n<p>Possiamo anche utilizzare CloudWatch per <strong>attivare procedure di rollback automatico<\/strong> in caso di allarmi su alcune metriche chiave. Il rollback viene attivato anche da distribuzioni non riuscite.<\/p>\n\n\n\n<p>Infine, la riproducibilit\u00e0, la continuit\u00e0 e il monitoraggio di un carico di lavoro ML consentono il processo di messa a punto di costi\/prestazioni, che avviene ciclicamente durante tutto il ciclo di vita del workflow.<\/p>\n\n\n\n<h1 class=\"wp-block-heading\">Per riassumere<\/h1>\n\n\n\n<p>In questo articolo, abbiamo approfondito le caratteristiche del paradigma MLOps, mostrando come sono stati adottati concetti e pratiche della sua controparte DevOps per consentire al Machine Learning di adattarsi ai problemi del mondo reale e risolvere il cosiddetto deployment gap.<\/p>\n\n\n\n<p>Abbiamo dimostrato che, mentre i carichi di lavoro del software tradizionale hanno cicli di vita pi\u00f9 lineari, i problemi di Machine Learning si basano su tre macro-aree: Dati, Modello e Codice che sono profondamente interconnessi e forniscono un feedback continuo l&#8217;uno all&#8217;altro.<\/p>\n\n\n\n<p>Abbiamo visto come affrontare questi particolari flussi di lavoro e come il paradigma MLOps permetta di gestire alcuni aspetti unici come le complessit\u00e0 nella gestione del codice del modello in Jupyter Notebook, esplorare i set di dati in modo efficiente con processi ETL corretti e fornire cicli di feedback rapidi e flessibili basati su metriche di produzione.<\/p>\n\n\n\n<p>I modelli sono la seconda cosa pi\u00f9 importante dopo i dati. Abbiamo appreso alcune strategie per evitare la deriva dei concetti e l&#8217;invecchiamento del modello nel tempo, come il training continuo, che richiede una soluzione di monitoraggio adeguata per fornire metriche di qualit\u00e0 sulle inferenze e una pipeline adeguata per invocare una nuova analisi del modello.<\/p>\n\n\n\n<p>AWS fornisce alcuni servizi gestiti per aiutare con il training dei modelli e le pipeline in generale, come SageMaker AutoPilot e SageMaker Pipelines.<\/p>\n\n\n\n<p>Abbiamo anche visto come AWS consenta diversi modi di creare e distribuire modelli per l&#8217;inferenza, come l&#8217;utilizzo di modelli precostruiti o l&#8217;utilizzo di un container con codice e algoritmi personalizzati. Tutte le immagini vengono salvate e recuperate da Elastic Container Registry.<\/p>\n\n\n\n<p>Abbiamo parlato di come la collaborazione sia fondamentale a causa della natura sperimentale dei problemi di Machine Learning e di come AWS possa aiutare fornendo un IDE gestito all-in-one chiamato SageMaker Studio.<\/p>\n\n\n\n<p>Abbiamo funzionalit\u00e0 come SageMaker Experiments per la gestione di pi\u00f9 esperimenti, SageMaker Feature Store per raccogliere e trasformare in modo efficiente le etichette dei dati o SageMaker Model Monitoring e SageMaker Debugger per verificare la correttezza del modello e trovare eventuali bug.<\/p>\n\n\n\n<p>Abbiamo anche discusso delle tecniche per rendere la nostra infrastruttura di Machine Learning solida, ripetibile e flessibile, facile da scalare su richieste, in base a requisiti che si evolvono nel tempo.<\/p>\n\n\n\n<p>Tali metodi implicano l&#8217;utilizzo di template AWS Cloudformation per sfruttare l&#8217;Infrastructure as Code per la ripetibilit\u00e0, AWS Step Functions per strutturare macchine a stati per gestire tutte le macro-aree e strumenti come AWS CodeBuild, CodeDeploy e CodePipeline per progettare adeguati flussi di CI\/CD.<\/p>\n\n\n\n<p>Ci auguriamo che ti sia piaciuto leggere questo articolo e che tu abbia imparato alcuni trucchi per gestire meglio i tuoi flussi di lavoro di Machine Learning.<\/p>\n\n\n\n<p>Come gi\u00e0 accennato, se il Machine Learning ti incuriosisce, ti invitiamo a dare un&#8217;occhiata ai nostri articoli con casi d&#8217;uso e analisi su ci\u00f2 che AWS offre per affrontare i problemi di machine learning qui su Proud2beCloud!<br>Come sempre, sentiti libero di commentare nella sezione sottostante e <a href=\"mailto:info@proud2becloud.com\">contattaci<\/a> per qualsiasi dubbio, domanda o idea! <\/p>\n\n\n\n<p>Ci vediamo su <strong>#Proud2beCloud<\/strong> tra un paio di settimane per un&#8217;altra storia emozionante!<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Quando affrontiamo i moderni problemi di Machine Learning in un ambiente AWS, c&#8217;\u00e8 molto pi\u00f9 che la tradizionale preparazione dei [&hellip;]<\/p>\n","protected":false},"author":6,"featured_media":3616,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[247],"tags":[435,297,295,410,533,459],"class_list":["post-3591","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ai-ml","tag-amazon-sagemaker","tag-continuous-deployment","tag-continuous-integration","tag-data-analytics","tag-machine-learning-it","tag-mlops"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v26.2 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>MLOps essentials: quattro principi fondamentali per il Machine Learning Operations su AWS - Proud2beCloud Blog<\/title>\n<meta name=\"description\" content=\"In questo articolo analizziamo le ragioni e i principi alla base del paradigma MLOps all&#039;interno dell&#039;ecosistema AWS.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/\" \/>\n<meta property=\"og:locale\" content=\"it_IT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"MLOps essentials: quattro principi fondamentali per il Machine Learning Operations su AWS\" \/>\n<meta property=\"og:description\" content=\"In questo articolo analizziamo le ragioni e i principi alla base del paradigma MLOps all&#039;interno dell&#039;ecosistema AWS.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/\" \/>\n<meta property=\"og:site_name\" content=\"Proud2beCloud Blog\" \/>\n<meta property=\"article:published_time\" content=\"2021-10-01T11:59:00+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2021-10-01T12:32:21+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/Copertina-blog-1-10-21_1-10-21social-ita.png\" \/>\n\t<meta property=\"og:image:width\" content=\"5001\" \/>\n\t<meta property=\"og:image:height\" content=\"2618\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"Alessandro Gaggia\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:title\" content=\"MLOps essentials: quattro principi fondamentali per il Machine Learning Operations su AWS\" \/>\n<meta name=\"twitter:description\" content=\"In questo articolo analizziamo le ragioni e i principi alla base del paradigma MLOps all&#039;interno dell&#039;ecosistema AWS.\" \/>\n<meta name=\"twitter:image\" content=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/10\/twitter-shared-link-15.png\" \/>\n<meta name=\"twitter:label1\" content=\"Scritto da\" \/>\n\t<meta name=\"twitter:data1\" content=\"Alessandro Gaggia\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tempo di lettura stimato\" \/>\n\t<meta name=\"twitter:data2\" content=\"19 minuti\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/\",\"url\":\"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/\",\"name\":\"MLOps essentials: quattro principi fondamentali per il Machine Learning Operations su AWS - Proud2beCloud Blog\",\"isPartOf\":{\"@id\":\"https:\/\/blog.besharp.it\/it\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/Copertina-blog-1-10-21_1-10-2021.png\",\"datePublished\":\"2021-10-01T11:59:00+00:00\",\"dateModified\":\"2021-10-01T12:32:21+00:00\",\"author\":{\"@id\":\"https:\/\/blog.besharp.it\/it\/#\/schema\/person\/f27fc12d10867c6ea6e0158ce4dd8924\"},\"description\":\"In questo articolo analizziamo le ragioni e i principi alla base del paradigma MLOps all'interno dell'ecosistema AWS.\",\"breadcrumb\":{\"@id\":\"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/#breadcrumb\"},\"inLanguage\":\"it-IT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"it-IT\",\"@id\":\"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/#primaryimage\",\"url\":\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/Copertina-blog-1-10-21_1-10-2021.png\",\"contentUrl\":\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/Copertina-blog-1-10-21_1-10-2021.png\",\"width\":1600,\"height\":900,\"caption\":\"MLOps essentials: four pillars for Machine Learning Operations on AWS\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/blog.besharp.it\/it\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"MLOps essentials: quattro principi fondamentali per il Machine Learning Operations su AWS\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/blog.besharp.it\/it\/#website\",\"url\":\"https:\/\/blog.besharp.it\/it\/\",\"name\":\"Proud2beCloud Blog\",\"description\":\"il blog di beSharp\",\"alternateName\":\"Proud2beCloud Blog\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/blog.besharp.it\/it\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"it-IT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/blog.besharp.it\/it\/#\/schema\/person\/f27fc12d10867c6ea6e0158ce4dd8924\",\"name\":\"Alessandro Gaggia\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"it-IT\",\"@id\":\"https:\/\/blog.besharp.it\/it\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/8b77337a9aa2325dad6a07134b026c2a0c9a2e2c54b91ad6c28260421f9f929f?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/8b77337a9aa2325dad6a07134b026c2a0c9a2e2c54b91ad6c28260421f9f929f?s=96&d=mm&r=g\",\"caption\":\"Alessandro Gaggia\"},\"description\":\"Head of software development di beSharp, Full-Stack developer, mi occupo di garantire lo stato dell\u2019arte di tutta la nostra codebase. Scrivo codice in quasi ogni linguaggio, ma prediligo Typescript. Respiro Informatica, Game design, Cinema, Fumetti e buona cucina. Disegno per passione!\",\"url\":\"https:\/\/blog.besharp.it\/it\/author\/alessandro-gaggia\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"MLOps essentials: quattro principi fondamentali per il Machine Learning Operations su AWS - Proud2beCloud Blog","description":"In questo articolo analizziamo le ragioni e i principi alla base del paradigma MLOps all'interno dell'ecosistema AWS.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/","og_locale":"it_IT","og_type":"article","og_title":"MLOps essentials: quattro principi fondamentali per il Machine Learning Operations su AWS","og_description":"In questo articolo analizziamo le ragioni e i principi alla base del paradigma MLOps all'interno dell'ecosistema AWS.","og_url":"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/","og_site_name":"Proud2beCloud Blog","article_published_time":"2021-10-01T11:59:00+00:00","article_modified_time":"2021-10-01T12:32:21+00:00","og_image":[{"width":5001,"height":2618,"url":"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/Copertina-blog-1-10-21_1-10-21social-ita.png","type":"image\/png"}],"author":"Alessandro Gaggia","twitter_card":"summary_large_image","twitter_title":"MLOps essentials: quattro principi fondamentali per il Machine Learning Operations su AWS","twitter_description":"In questo articolo analizziamo le ragioni e i principi alla base del paradigma MLOps all'interno dell'ecosistema AWS.","twitter_image":"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/10\/twitter-shared-link-15.png","twitter_misc":{"Scritto da":"Alessandro Gaggia","Tempo di lettura stimato":"19 minuti"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/","url":"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/","name":"MLOps essentials: quattro principi fondamentali per il Machine Learning Operations su AWS - Proud2beCloud Blog","isPartOf":{"@id":"https:\/\/blog.besharp.it\/it\/#website"},"primaryImageOfPage":{"@id":"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/#primaryimage"},"image":{"@id":"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/#primaryimage"},"thumbnailUrl":"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/Copertina-blog-1-10-21_1-10-2021.png","datePublished":"2021-10-01T11:59:00+00:00","dateModified":"2021-10-01T12:32:21+00:00","author":{"@id":"https:\/\/blog.besharp.it\/it\/#\/schema\/person\/f27fc12d10867c6ea6e0158ce4dd8924"},"description":"In questo articolo analizziamo le ragioni e i principi alla base del paradigma MLOps all'interno dell'ecosistema AWS.","breadcrumb":{"@id":"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/#breadcrumb"},"inLanguage":"it-IT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/"]}]},{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/#primaryimage","url":"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/Copertina-blog-1-10-21_1-10-2021.png","contentUrl":"https:\/\/blog.besharp.it\/wp-content\/uploads\/2021\/09\/Copertina-blog-1-10-21_1-10-2021.png","width":1600,"height":900,"caption":"MLOps essentials: four pillars for Machine Learning Operations on AWS"},{"@type":"BreadcrumbList","@id":"https:\/\/blog.besharp.it\/it\/mlops-essentials-quattro-principi-fondamentali-per-il-machine-learning-operations-su-aws\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/blog.besharp.it\/it\/"},{"@type":"ListItem","position":2,"name":"MLOps essentials: quattro principi fondamentali per il Machine Learning Operations su AWS"}]},{"@type":"WebSite","@id":"https:\/\/blog.besharp.it\/it\/#website","url":"https:\/\/blog.besharp.it\/it\/","name":"Proud2beCloud Blog","description":"il blog di beSharp","alternateName":"Proud2beCloud Blog","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/blog.besharp.it\/it\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"it-IT"},{"@type":"Person","@id":"https:\/\/blog.besharp.it\/it\/#\/schema\/person\/f27fc12d10867c6ea6e0158ce4dd8924","name":"Alessandro Gaggia","image":{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/blog.besharp.it\/it\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/8b77337a9aa2325dad6a07134b026c2a0c9a2e2c54b91ad6c28260421f9f929f?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/8b77337a9aa2325dad6a07134b026c2a0c9a2e2c54b91ad6c28260421f9f929f?s=96&d=mm&r=g","caption":"Alessandro Gaggia"},"description":"Head of software development di beSharp, Full-Stack developer, mi occupo di garantire lo stato dell\u2019arte di tutta la nostra codebase. Scrivo codice in quasi ogni linguaggio, ma prediligo Typescript. Respiro Informatica, Game design, Cinema, Fumetti e buona cucina. Disegno per passione!","url":"https:\/\/blog.besharp.it\/it\/author\/alessandro-gaggia\/"}]}},"_links":{"self":[{"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/posts\/3591","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/comments?post=3591"}],"version-history":[{"count":0,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/posts\/3591\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/media\/3616"}],"wp:attachment":[{"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/media?parent=3591"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/categories?post=3591"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/tags?post=3591"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}