{"id":8710,"date":"2026-06-17T08:00:00","date_gmt":"2026-06-17T06:00:00","guid":{"rendered":"https:\/\/blog.besharp.it\/?p=8710"},"modified":"2026-06-17T11:19:04","modified_gmt":"2026-06-17T09:19:04","slug":"telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi","status":"publish","type":"post","link":"https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/","title":{"rendered":"Telemetria Enterprise su AWS: Gestire backfill di dati massivi con ECS e Databricks senza far esplodere i costi"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Quando si progetta un&#8217;architettura di data ingestion per grandi volumi di dati, la teoria e la pratica spesso si scontrano. Sulla carta, i servizi cloud nativi offrono soluzioni pronte all&#8217;uso per qualsiasi scenario; nel mondo reale, ci si trova invece a fare i conti con limiti di throughput, eccezioni impreviste e, soprattutto, con l&#8217;impatto economico delle risorse configurate.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">In questo articolo voglio raccontarvi il dietro le quinte di un progetto di ingestion e trasformazione dei dati che abbiamo completato di recente per un nostro cliente, concentrandoci su una sfida architetturale specifica: il recupero dello storico dei dati e la gestione dei costi di AWS Kinesis Firehose.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Il contesto e l&#8217;architettura iniziale<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Il cliente aveva l&#8217;esigenza di centralizzare i dati di telemetria della propria flotta di veicoli aziendali. Questi dati venivano raccolti da un provider esterno e messi a disposizione tramite REST API. L&#8217;obiettivo era creare una pipeline capace di catturare questi dati in modalit\u00e0 quasi real-time (una sorta di CDC via API) e standardizzarli per l&#8217;analisi avanzata su Databricks.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La strategia adottata per lo scarico consisteva nell&#8217;implementare una serie di servizi logici configurati per effettuare polling continuo sugli endpoint del provider: una volta avviati, questi componenti effettuavano chiamate cicliche per scaricare i dati a flusso continuo, mettendosi in attesa solo quando non risultavano nuovi record da recuperare.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Per contestualizzare meglio il processo, ecco lo schema dell&#8217;architettura che illustra la pipeline descritta nei paragrafi seguenti.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"274\" defer\" src=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2026\/06\/image1-1024x274.png\" alt=\"\" class=\"wp-image-8690\" srcset=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2026\/06\/image1-1024x274.png 1024w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2026\/06\/image1-400x107.png 400w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2026\/06\/image1-768x205.png 768w, https:\/\/blog.besharp.it\/wp-content\/uploads\/2026\/06\/image1.png 1201w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Per l&#8217;infrastruttura di calcolo abbiamo deciso di sfruttare le <strong>ECS Managed Instances<\/strong>, allora appena uscite.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Questa funzionalit\u00e0 di Amazon ECS permette di orchestrare ed eseguire container Docker sfruttando una capacit\u00e0 di calcolo dedicata e ottimizzata, integrata direttamente all&#8217;interno di un cluster gestito da AWS. Per noi \u00e8 stata la soluzione ideale: ci ha permesso di isolare i microservizi di polling in un ambiente sicuro e circoscritto, mantenendo tutta la flessibilit\u00e0, la scalabilit\u00e0 e la semplicit\u00e0 di gestione tipiche dell&#8217;ecosistema AWS.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Se volete approfondire come funziona questo approccio, date un&#8217;occhiata all&#8217;articolo del nostro caro collega Damiano: <a href=\"https:\/\/blog.besharp.it\/it\/quando-il-serverless-gira-sui-server-nuove-opzioni-per-aws-lambda-e-aws-fargate-con-le-managed-instances\/\" target=\"_blank\" rel=\"noreferrer noopener\">Quando il Serverless gira sui Server: nuove opzioni per AWS Lambda e AWS Fargate con le Managed Instances<\/a>.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Fin dal giorno uno, l&#8217;architettura su ECS \u00e8 stata strutturata per gestire in modo intelligente un mapping di sorgenti dati (divise per country ed entit\u00e0), separando i flussi in base alla frequenza di aggiornamento:<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">1. I Servizi Real-time (CDC Long-Running)<\/h4>\n\n\n\n<p class=\"wp-block-paragraph\">Per i dati ad alta frequenza che necessitano di un flusso continuo, abbiamo configurato <strong>15 servizi ECS sempre attivi<\/strong>. Questa numerica nasceva dalla combinazione di 5 database diversi divisi per Country (nazioni), ognuno dei quali conteneva 3 entit\u00e0 principali ad alto aggiornamento. Questi container gestivano la Change Data Capture (CDC) costante.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">2. I Task Schedulati (Batch settimanali)<\/h4>\n\n\n\n<p class=\"wp-block-paragraph\">Allo stesso tempo, c&#8217;erano altre 3 entit\u00e0 che si aggiornavano molto meno frequentemente e che contenevano volumi di dati ridotti. Lasciare dei servizi sempre accesi a fare polling su queste tabelle sarebbe stato uno spreco di risorse. Abbiamo quindi implementato altri 15 task ECS speculari (5 Country x 3 entit\u00e0), ma configurati come task schedulati, eseguiti una volta alla settimana per scaricare i dati e poi spegnersi subito dopo.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La scelta di Firehose non \u00e8 stata casuale: per lo streaming di dati correnti \u00e8 uno strumento formidabile. Essendo un servizio completamente gestito (<em>serverless<\/em>), si occupa in totale autonomia di scalare la capacit\u00e0 in base al traffico in ingresso, aggregare i dati in memoria (buffering per tempo o per dimensione del file) e scriverli su S3 gi\u00e0 partizionati per data. Questo ci ha permesso di evitare la scrittura di codice custom per la gestione dei file e di azzerare i costi di manutenzione infrastrutturale.&nbsp;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Finch\u00e9 la pipeline ha elaborato i soli dati correnti, il sistema si \u00e8 dimostrato estremamente stabile ed efficiente.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Il caricamento dello storico e il collo di bottiglia di Firehose<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">I problemi sono emersi quando, raggiunto lo stato di maturit\u00e0 della pipeline, \u00e8 stato avviato il recupero dello <strong>storico dei dati<\/strong>. Parliamo di una mole di dati imponente, quantificabile in decine di miliardi di record per una dimensione complessiva di pi\u00f9 di cento Terabyte di storage occupato.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Nel momento in cui abbiamo aperto i rubinetti per importare i dati pregressi, l&#8217;architettura basata su Firehose ha mostrato i suoi limiti strutturali ed economici sotto carichi massivi:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li><strong>Errori di PartitionCountExceeded<\/strong>: Il volume di richieste e la granularit\u00e0 del partizionamento hanno saturato le quote di Firehose, generando eccezioni e rallentando il processo di ingestion.<\/li>\n\n\n\n<li><strong>Esplosione dei costi<\/strong>: Firehose addebita i costi in base ai GB di dati elaborati. Applicare questa metrica a decine di Terabyte in un lasso di tempo ristretto ha causato un picco di spesa insostenibile e ingiustificato per dei dati &#8220;freddi&#8221;.<\/li>\n<\/ol>\n\n\n\n<h2 class=\"wp-block-heading\">La soluzione: Il bypass per i dati massivi<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Davanti a questo scenario, abbiamo capito che una pipeline ottimizzata per lo streaming real-time non poteva essere adatta a un caricamento massivo di tipo batch. Abbiamo quindi diviso la strategia di ingestion:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Dati correnti<\/strong>: Sono rimasti sulla pipeline originale (ECS -&gt; Firehose -&gt; S3), dove i volumi ridotti rendono Firehose economico e scalabile.<\/li>\n\n\n\n<li><strong>Dati storici<\/strong>: Abbiamo modificato la logica dei microservizi su ECS per effettuare un bypass totale di Firehose. I container scaricavano i JSON storici dalle API e li scrivevano direttamente sul bucket S3 tramite SDK AWS.<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Per mettere in pratica questa nuova strategia senza sovraccaricare il sistema, abbiamo ripensato il modo di invocare i container: anzich\u00e9 configurarli come servizi continui, li abbiamo eseguiti come <strong>task ECS <\/strong><strong><em>one-shot<\/em><\/strong>. Passando una data di inizio e una data di fine come <strong>variabili d&#8217;ambiente<\/strong> a ciascun task, siamo riusciti a segmentare lo storico e a <strong>parallelizzare l&#8217;ingestion<\/strong> su pi\u00f9 container contemporaneamente. In questo modo, i task scaricavano i JSON storici dalle API per lo specifico slot temporale assegnato e li scrivevano direttamente sul bucket S3 tramite SDK AWS, spegnendosi subito dopo.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Questo approccio ci ha richiesto un piccolo compromesso architetturale: <strong>abbiamo dovuto sacrificare parte del <\/strong><strong><em>dynamic partitioning<\/em><\/strong> nativo di Firehose. Quando Firehose scrive su S3 partizionando i dati, rimuove i campi di partizione dal payload JSON per usarli solo come nomi delle cartelle. Scrivendo direttamente da ECS, invece, i nostri JSON mantenevano tutte le colonne all&#8217;interno del file.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Per capire il problema, basti pensare che un tipico path strutturato da Firehose si presentava cos\u00ec:<\/p>\n\n\n\n<code><strong>s3:\/\/nome-bucket\/raw\/database=fleetdb_de\/entity=FaultData\/year=2025\/month=01\/day=01\/file.json<\/code><\/strong>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n\n\n\nPer evitare che Databricks vedesse queste colonne come duplicate (una volta dal percorso della cartella di S3 e una volta dal contenuto del file), abbiamo deciso di non replicare la struttura ultra-granularizzata di Firehose, ma di salvare i dati storici direttamente al livello della partizione principale <code><strong>year=<\/code><\/strong>. In questo modo abbiamo evitato la necessit\u00e0 di dover fare un &#8220;drop&#8221; preventivo delle colonne da codice ECS, delegando la normalizzazione della struttura direttamente alla fase successiva.\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Questa modifica architetturale ha risolto istantaneamente gli errori di partizionamento, azzerato i costi di transito di Firehose per lo storico e velocizzato sensibilmente il completamento del caricamento.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Da JSON a Delta Lake<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Una volta archiviati i file JSON grezzi nella <em>Bronze Zone<\/em> su S3, il flusso si \u00e8 spostato su <strong>Databricks<\/strong> per l&#8217;esecuzione delle pipeline di ETL e la strutturazione del dato.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Abbiamo implementato dei job Databricks che si occupano di standardizzare i file: i JSON grezzi vengono letti, tipizzati e convertiti nel formato <strong>Delta Lake<\/strong>, per poi essere memorizzati nella <em>Silver Zone<\/em>. L&#8217;adozione del formato Delta ha garantito al cliente transazioni ACID, performance di query ottimizzate e una &#8220;single source of truth&#8221; affidabile.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Da quel punto in poi, la nostra pipeline infrastrutturale ha ceduto il passo alle logiche di business: il cliente ha potuto iniziare a sviluppare in totale autonomia i propri job di analisi e reportistica su Databricks, sfruttando un patrimonio informativo finalmente pulito e accessibile.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Conclusione<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Questo progetto ci ha confermato che nel Cloud Data Engineering non esiste una soluzione universale. Kinesis Firehose resta uno strumento eccellente per lo streaming di dati correnti, ma quando si affrontano migrazioni storiche nell&#8217;ordine dei Terabyte, l&#8217;ingegneria del software richiede flessibilit\u00e0: a volte, eliminare un intermediario gestito \u00e8 la chiave per salvare performance e budget.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h4 class=\"wp-block-heading\">About Proud2beCloud<\/h4>\n\n\n\n<p class=\"wp-block-paragraph\">Proud2beCloud \u00e8 il blog di&nbsp;<a href=\"https:\/\/www.besharp.it\/\" target=\"_blank\" rel=\"noreferrer noopener\">beSharp<\/a>, APN Premier Consulting Partner italiano esperto nella progettazione, implementazione e gestione di infrastrutture Cloud complesse e servizi AWS avanzati. Prima di essere scrittori, siamo Solutions Architect che, dal 2007, lavorano quotidianamente con i servizi AWS. Siamo innovatori alla costante ricerca della soluzione pi\u00f9 all&#8217;avanguardia per noi e per i nostri clienti. Su Proud2beCloud condividiamo regolarmente i nostri migliori spunti con chi come noi, per lavoro o per passione, lavora con il Cloud di AWS. Partecipa alla discussione!<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Quando si progetta un&#8217;architettura di data ingestion per grandi volumi di dati, la teoria e la pratica spesso si scontrano. [&hellip;]<\/p>\n","protected":false},"author":39,"featured_media":8716,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[474],"tags":[],"class_list":["post-8710","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-analytics"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.8 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Telemetria Enterprise su AWS: Gestire backfill di dati massivi con ECS e Databricks senza far esplodere i costi - Proud2beCloud Blog<\/title>\n<meta name=\"description\" content=\"Oltre i limiti di AWS Kinesis Firehose: gestire i backfill di grandi volumi di dati contenendo i costi con ECS e Databricks.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/\" \/>\n<meta property=\"og:locale\" content=\"it_IT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Telemetria Enterprise su AWS: Gestire backfill di dati massivi con ECS e Databricks senza far esplodere i costi\" \/>\n<meta property=\"og:description\" content=\"Oltre i limiti di AWS Kinesis Firehose: gestire i backfill di grandi volumi di dati contenendo i costi con ECS e Databricks.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/\" \/>\n<meta property=\"og:site_name\" content=\"Proud2beCloud Blog\" \/>\n<meta property=\"article:published_time\" content=\"2026-06-17T06:00:00+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2026-06-17T09:19:04+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2026\/06\/Copertina-per-Social-59.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1200\" \/>\n\t<meta property=\"og:image:height\" content=\"628\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Keidi Xhafa\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:title\" content=\"Telemetria Enterprise su AWS: Gestire backfill di dati massivi con ECS e Databricks senza far esplodere i costi\" \/>\n<meta name=\"twitter:description\" content=\"Oltre i limiti di AWS Kinesis Firehose: gestire i backfill di grandi volumi di dati contenendo i costi con ECS e Databricks.\" \/>\n<meta name=\"twitter:image\" content=\"https:\/\/blog.besharp.it\/wp-content\/uploads\/2026\/06\/Copertina-per-Social-59.jpg\" \/>\n<meta name=\"twitter:label1\" content=\"Scritto da\" \/>\n\t<meta name=\"twitter:data1\" content=\"Keidi Xhafa\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tempo di lettura stimato\" \/>\n\t<meta name=\"twitter:data2\" content=\"7 minuti\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\\\/\"},\"author\":{\"name\":\"Keidi Xhafa\",\"@id\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/#\\\/schema\\\/person\\\/0e28245d6e848d6c66e9fd8bf776ca1f\"},\"headline\":\"Telemetria Enterprise su AWS: Gestire backfill di dati massivi con ECS e Databricks senza far esplodere i costi\",\"datePublished\":\"2026-06-17T06:00:00+00:00\",\"dateModified\":\"2026-06-17T09:19:04+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\\\/\"},\"wordCount\":261,\"image\":{\"@id\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/blog.besharp.it\\\/wp-content\\\/uploads\\\/2026\\\/06\\\/Copertina-per-Blog-1.png\",\"articleSection\":[\"Data &amp; Analytics\"],\"inLanguage\":\"it-IT\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\\\/\",\"url\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\\\/\",\"name\":\"Telemetria Enterprise su AWS: Gestire backfill di dati massivi con ECS e Databricks senza far esplodere i costi - Proud2beCloud Blog\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/blog.besharp.it\\\/wp-content\\\/uploads\\\/2026\\\/06\\\/Copertina-per-Blog-1.png\",\"datePublished\":\"2026-06-17T06:00:00+00:00\",\"dateModified\":\"2026-06-17T09:19:04+00:00\",\"author\":{\"@id\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/#\\\/schema\\\/person\\\/0e28245d6e848d6c66e9fd8bf776ca1f\"},\"description\":\"Oltre i limiti di AWS Kinesis Firehose: gestire i backfill di grandi volumi di dati contenendo i costi con ECS e Databricks.\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\\\/#breadcrumb\"},\"inLanguage\":\"it-IT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/blog.besharp.it\\\/it\\\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"it-IT\",\"@id\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\\\/#primaryimage\",\"url\":\"https:\\\/\\\/blog.besharp.it\\\/wp-content\\\/uploads\\\/2026\\\/06\\\/Copertina-per-Blog-1.png\",\"contentUrl\":\"https:\\\/\\\/blog.besharp.it\\\/wp-content\\\/uploads\\\/2026\\\/06\\\/Copertina-per-Blog-1.png\",\"width\":1600,\"height\":900,\"caption\":\"Telemetria Enterprise su AWS: Gestire backfill di dati massivi con ECS e Databricks senza far esplodere i costi\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Telemetria Enterprise su AWS: Gestire backfill di dati massivi con ECS e Databricks senza far esplodere i costi\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/#website\",\"url\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/\",\"name\":\"Proud2beCloud Blog\",\"description\":\"il blog di beSharp\",\"alternateName\":\"Proud2beCloud Blog\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"it-IT\"},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/#\\\/schema\\\/person\\\/0e28245d6e848d6c66e9fd8bf776ca1f\",\"name\":\"Keidi Xhafa\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"it-IT\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/1de62a3bfd64bcaf5c122b33ad4298f0f256a46792ddd69abfb33797c43d6bc1?s=96&d=mm&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/1de62a3bfd64bcaf5c122b33ad4298f0f256a46792ddd69abfb33797c43d6bc1?s=96&d=mm&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/1de62a3bfd64bcaf5c122b33ad4298f0f256a46792ddd69abfb33797c43d6bc1?s=96&d=mm&r=g\",\"caption\":\"Keidi Xhafa\"},\"description\":\"DevOps Engineer @ beSharp. Driven since childhood by a deep curiosity for technology and computers, combined with a natural obsession for making things work smoothly, which is pretty much how I ended up here today. When I\u2019m not building backends and ETL jobs, you can find me enjoying good food, watching movies, playing video games, or casting spells in a Magic: The Gathering match.\",\"url\":\"https:\\\/\\\/blog.besharp.it\\\/it\\\/author\\\/keidi-xhafa\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Telemetria Enterprise su AWS: Gestire backfill di dati massivi con ECS e Databricks senza far esplodere i costi - Proud2beCloud Blog","description":"Oltre i limiti di AWS Kinesis Firehose: gestire i backfill di grandi volumi di dati contenendo i costi con ECS e Databricks.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/","og_locale":"it_IT","og_type":"article","og_title":"Telemetria Enterprise su AWS: Gestire backfill di dati massivi con ECS e Databricks senza far esplodere i costi","og_description":"Oltre i limiti di AWS Kinesis Firehose: gestire i backfill di grandi volumi di dati contenendo i costi con ECS e Databricks.","og_url":"https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/","og_site_name":"Proud2beCloud Blog","article_published_time":"2026-06-17T06:00:00+00:00","article_modified_time":"2026-06-17T09:19:04+00:00","og_image":[{"width":1200,"height":628,"url":"https:\/\/blog.besharp.it\/wp-content\/uploads\/2026\/06\/Copertina-per-Social-59.jpg","type":"image\/jpeg"}],"author":"Keidi Xhafa","twitter_card":"summary_large_image","twitter_title":"Telemetria Enterprise su AWS: Gestire backfill di dati massivi con ECS e Databricks senza far esplodere i costi","twitter_description":"Oltre i limiti di AWS Kinesis Firehose: gestire i backfill di grandi volumi di dati contenendo i costi con ECS e Databricks.","twitter_image":"https:\/\/blog.besharp.it\/wp-content\/uploads\/2026\/06\/Copertina-per-Social-59.jpg","twitter_misc":{"Scritto da":"Keidi Xhafa","Tempo di lettura stimato":"7 minuti"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/#article","isPartOf":{"@id":"https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/"},"author":{"name":"Keidi Xhafa","@id":"https:\/\/blog.besharp.it\/it\/#\/schema\/person\/0e28245d6e848d6c66e9fd8bf776ca1f"},"headline":"Telemetria Enterprise su AWS: Gestire backfill di dati massivi con ECS e Databricks senza far esplodere i costi","datePublished":"2026-06-17T06:00:00+00:00","dateModified":"2026-06-17T09:19:04+00:00","mainEntityOfPage":{"@id":"https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/"},"wordCount":261,"image":{"@id":"https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/#primaryimage"},"thumbnailUrl":"https:\/\/blog.besharp.it\/wp-content\/uploads\/2026\/06\/Copertina-per-Blog-1.png","articleSection":["Data &amp; Analytics"],"inLanguage":"it-IT"},{"@type":"WebPage","@id":"https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/","url":"https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/","name":"Telemetria Enterprise su AWS: Gestire backfill di dati massivi con ECS e Databricks senza far esplodere i costi - Proud2beCloud Blog","isPartOf":{"@id":"https:\/\/blog.besharp.it\/it\/#website"},"primaryImageOfPage":{"@id":"https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/#primaryimage"},"image":{"@id":"https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/#primaryimage"},"thumbnailUrl":"https:\/\/blog.besharp.it\/wp-content\/uploads\/2026\/06\/Copertina-per-Blog-1.png","datePublished":"2026-06-17T06:00:00+00:00","dateModified":"2026-06-17T09:19:04+00:00","author":{"@id":"https:\/\/blog.besharp.it\/it\/#\/schema\/person\/0e28245d6e848d6c66e9fd8bf776ca1f"},"description":"Oltre i limiti di AWS Kinesis Firehose: gestire i backfill di grandi volumi di dati contenendo i costi con ECS e Databricks.","breadcrumb":{"@id":"https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/#breadcrumb"},"inLanguage":"it-IT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/"]}]},{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/#primaryimage","url":"https:\/\/blog.besharp.it\/wp-content\/uploads\/2026\/06\/Copertina-per-Blog-1.png","contentUrl":"https:\/\/blog.besharp.it\/wp-content\/uploads\/2026\/06\/Copertina-per-Blog-1.png","width":1600,"height":900,"caption":"Telemetria Enterprise su AWS: Gestire backfill di dati massivi con ECS e Databricks senza far esplodere i costi"},{"@type":"BreadcrumbList","@id":"https:\/\/blog.besharp.it\/it\/telemetria-enterprise-su-aws-gestire-backfill-di-dati-massivi-con-ecs-e-databricks-senza-far-esplodere-i-costi\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/blog.besharp.it\/it\/"},{"@type":"ListItem","position":2,"name":"Telemetria Enterprise su AWS: Gestire backfill di dati massivi con ECS e Databricks senza far esplodere i costi"}]},{"@type":"WebSite","@id":"https:\/\/blog.besharp.it\/it\/#website","url":"https:\/\/blog.besharp.it\/it\/","name":"Proud2beCloud Blog","description":"il blog di beSharp","alternateName":"Proud2beCloud Blog","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/blog.besharp.it\/it\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"it-IT"},{"@type":"Person","@id":"https:\/\/blog.besharp.it\/it\/#\/schema\/person\/0e28245d6e848d6c66e9fd8bf776ca1f","name":"Keidi Xhafa","image":{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/secure.gravatar.com\/avatar\/1de62a3bfd64bcaf5c122b33ad4298f0f256a46792ddd69abfb33797c43d6bc1?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/1de62a3bfd64bcaf5c122b33ad4298f0f256a46792ddd69abfb33797c43d6bc1?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/1de62a3bfd64bcaf5c122b33ad4298f0f256a46792ddd69abfb33797c43d6bc1?s=96&d=mm&r=g","caption":"Keidi Xhafa"},"description":"DevOps Engineer @ beSharp. Driven since childhood by a deep curiosity for technology and computers, combined with a natural obsession for making things work smoothly, which is pretty much how I ended up here today. When I\u2019m not building backends and ETL jobs, you can find me enjoying good food, watching movies, playing video games, or casting spells in a Magic: The Gathering match.","url":"https:\/\/blog.besharp.it\/it\/author\/keidi-xhafa\/"}]}},"_links":{"self":[{"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/posts\/8710","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/users\/39"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/comments?post=8710"}],"version-history":[{"count":13,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/posts\/8710\/revisions"}],"predecessor-version":[{"id":8759,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/posts\/8710\/revisions\/8759"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/media\/8716"}],"wp:attachment":[{"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/media?parent=8710"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/categories?post=8710"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.besharp.it\/it\/wp-json\/wp\/v2\/tags?post=8710"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}