Skip to main content

Durata corso:

1 giorno

Costo:

420,00 €

Introduzione Data Warehouse

Codice: FDW04

Il corso fornisce una panoramica delle fondamenta del Data Warehouse, focalizzandosi su concetti chiave come la differenza tra un ambiente on-premise e un Data Warehouse gestito. Inoltre, approfondisce il concetto di Data Lake e le soluzioni associate, esaminando anche i fondamenti di Hadoop e MapReduce. Il corso esplorerà le diverse prospettive del Data Lake come “Single Source of Truth” e introdurrà il concetto di Serverless pipeline. Saranno presentate e analizzate inoltre soluzioni pratiche di Business Intelligence e di visualizzazione dei dati in ambienti complessi di Big Data.

Modalità di erogazione
In aula o Live Virtual Classroom

Attestato di partecipazione
Al termine del corso verrà rilasciato l’attestato di frequenza

Contenuti del corso
  • Introduzione al Data Warehouse
  • Confronto tra On-Premises e Managed Data Warehouse
  • Concetto di Data Lake
  • Fondamenti di Hadoop e MapReduce
  • Ecosistema Hadoop
  • Funzioni di Map e Reduce in MapReduce
  • Confronto tra MapReduce e RMDBS
  • Frameworks Hadoop
  • Utilizzo di Hadoop nel Cloud
  • Demo: Hadoop nel Cloud (EMR & Dataproc)
  • Concetto di Serverless Pipeline
  • Significato e vantaggi del Serverless
  • Demo: Creazione di una Serverless Pipeline
  • Visualizzazione dei Dati
  • Strumenti di Business Intelligence
  • Elastic Search, Logstash e Kibana
  • Demo: Visualizzazione dei Dati
  • Soluzioni Big Data nel Mondo Reale
  • Casi d’Uso Tipici nel Business
Partecipanti

Il corso è rivolto a chi vuole cominciare ad addentrarsi nel vasto mondo della collezione, dell’analisi e dell’utilizzo dei Dati in grandi quantità.

Prerequisiti
  • È richiesta una conoscenza elementare delle tecnologie IT più diffuse quali sistemi operativi, applicativi e degli strumenti di analisi dei dati.
  • È gradita una conoscenza di base di DataBase relazionali.
Obiettivi
  • Comprendere le basi del Data Warehouse e le differenze tra ambienti on-premises e managed data warehouse.
  • Esplorare il concetto di Data Lake e valutare le soluzioni ad esso associate.
  • Acquisire una conoscenza fondamentale di Hadoop e MapReduce, esaminando l’Hadoop EcoSystem e le differenze tra MapReduce e RDBMS.
  • Approfondire la comprensione del concetto di “Single Source of Truth” e delle soluzioni di Data Lake.
  • Analizzare le possibilità offerte da Hadoop in ambienti cloud, con una demo pratica su Amazon EMR e Google Dataproc.
  • Comprendere il concetto di serverless pipeline e creare un esempio pratico attraverso una demo.
  • Esplorare strumenti di Business Intelligence e di visualizzazione dei dati, con un focus su Elastic Search, Logstash e Kibana.
  • Analizzare casi d’uso tipici di soluzioni di Big Data in contesti reali di business.
Lingue
Italiano
Vuoi ulteriori info?
Stiamo caricando il listino completo dei corsi
My Agile Privacy
Questo sito utilizza cookie tecnici e di profilazione. Cliccando su accetta si autorizzano tutti i cookie di profilazione. Cliccando su rifiuta o la X si rifiutano tutti i cookie di profilazione. Cliccando su personalizza è possibile selezionare quali cookie di profilazione attivare.