Durata corso
Prezzo
Introduzione Data Warehouse
Codice: FDW04
Il corso fornisce una panoramica delle fondamenta del Data Warehouse, focalizzandosi su concetti chiave come la differenza tra un ambiente on-premise e un Data Warehouse gestito. Inoltre, approfondisce il concetto di Data Lake e le soluzioni associate, esaminando anche i fondamenti di Hadoop e MapReduce. Il corso esplorerà le diverse prospettive del Data Lake come “Single Source of Truth” e introdurrà il concetto di Serverless pipeline. Saranno presentate e analizzate inoltre soluzioni pratiche di Business Intelligence e di visualizzazione dei dati in ambienti complessi di Big Data.
Modalità di erogazione
In aula o Live Virtual Classroom
Attestato di partecipazione
Al termine del corso verrà rilasciato l’attestato di frequenza
- Introduzione al Data Warehouse
- Confronto tra On-Premises e Managed Data Warehouse
- Concetto di Data Lake
- Fondamenti di Hadoop e MapReduce
- Ecosistema Hadoop
- Funzioni di Map e Reduce in MapReduce
- Confronto tra MapReduce e RMDBS
- Frameworks Hadoop
- Utilizzo di Hadoop nel Cloud
- Demo: Hadoop nel Cloud (EMR & Dataproc)
- Concetto di Serverless Pipeline
- Significato e vantaggi del Serverless
- Demo: Creazione di una Serverless Pipeline
- Visualizzazione dei Dati
- Strumenti di Business Intelligence
- Elastic Search, Logstash e Kibana
- Demo: Visualizzazione dei Dati
- Soluzioni Big Data nel Mondo Reale
- Casi d’Uso Tipici nel Business
Il corso è rivolto a chi vuole cominciare ad addentrarsi nel vasto mondo della collezione, dell’analisi e dell’utilizzo dei Dati in grandi quantità.
- È richiesta una conoscenza elementare delle tecnologie IT più diffuse quali sistemi operativi, applicativi e degli strumenti di analisi dei dati.
- È gradita una conoscenza di base di DataBase relazionali.
- Comprendere le basi del Data Warehouse e le differenze tra ambienti on-premises e managed data warehouse.
- Esplorare il concetto di Data Lake e valutare le soluzioni ad esso associate.
- Acquisire una conoscenza fondamentale di Hadoop e MapReduce, esaminando l’Hadoop EcoSystem e le differenze tra MapReduce e RDBMS.
- Approfondire la comprensione del concetto di “Single Source of Truth” e delle soluzioni di Data Lake.
- Analizzare le possibilità offerte da Hadoop in ambienti cloud, con una demo pratica su Amazon EMR e Google Dataproc.
- Comprendere il concetto di serverless pipeline e creare un esempio pratico attraverso una demo.
- Esplorare strumenti di Business Intelligence e di visualizzazione dei dati, con un focus su Elastic Search, Logstash e Kibana.
- Analizzare casi d’uso tipici di soluzioni di Big Data in contesti reali di business.