IMPARA APACHE SPARK: Costruisci Pipeline Scalabili con PySpark e Ottimizzazione: 2
Uitgelicht
|
15,90 |
Naar shop
|
|
15,94 |
Naar shop
|
|
15,94 |
Naar shop
|
Beschrijving
Bol
IMPARA APACHE SPARK Costruisci Pipeline Scalabili con PySpark e OttimizzazioneQuesto libro è rivolto a studenti, sviluppatori, ingegneri dei dati, data scientist e professionisti IT che desiderano padroneggiare Apache Spark nella pratica, in ambienti aziendali, cloud pubblici e integrazioni moderne. Il lettore imparerà a progettare, implementare e gestire pipeline scalabili per l'elaborazione di dati su larga scala, orchestrando workload distribuiti su AWS EMR, Databricks, Azure Synapse e Google Cloud Dataproc.Il contenuto copre l'integrazione con Hadoop, Hive, Kafka, SQL, Delta Lake, MongoDB e Python, oltre a tecniche avanzate di tuning, ottimizzazione dei job, analisi in tempo reale, machine learning con MLlib e automazione dei workflow orientati alla produzione.Include: - Implementazione di pipeline ETL ed ELT con Spark SQL e DataFrame - Elaborazione di dati in streaming e integrazione con Kafka e AWS Kinesis - Ottimizzazione dei job distribuiti, tuning delle prestazioni e utilizzo della Spark UI - Integrazione di Spark con S3, Data Lake, NoSQL e database relazionali - Deploy su cluster gestiti in AWS, Azure e Google Cloud - Machine learning applicato con MLlib, Delta Lake e Databricks - Automazione delle routine, monitoraggio e scalabilità per Big DataAl termine, il lettore padroneggerà Apache Spark come soluzione professionale per l'analisi dei dati, l'automazione dei processi e il machine learning in ambienti complessi, distribuiti e ad alte prestazioni.
IMPARA APACHE SPARK Costruisci Pipeline Scalabili con PySpark e OttimizzazioneQuesto libro è rivolto a studenti, sviluppatori, ingegneri dei dati, data scientist e professionisti IT che desiderano padroneggiare Apache Spark nella pratica, in ambienti aziendali, cloud pubblici e integrazioni moderne. Il lettore imparerà a progettare, implementare e gestire pipeline scalabili per l'elaborazione di dati su larga scala, orchestrando workload distribuiti su AWS EMR, Databricks, Azure Synapse e Google Cloud Dataproc.Il contenuto copre l'integrazione con Hadoop, Hive, Kafka, SQL, Delta Lake, MongoDB e Python, oltre a tecniche avanzate di tuning, ottimizzazione dei job, analisi in tempo reale, machine learning con MLlib e automazione dei workflow orientati alla produzione.Include: - Implementazione di pipeline ETL ed ELT con Spark SQL e DataFrame - Elaborazione di dati in streaming e integrazione con Kafka e AWS Kinesis - Ottimizzazione dei job distribuiti, tuning delle prestazioni e utilizzo della Spark UI - Integrazione di Spark con S3, Data Lake, NoSQL e database relazionali - Deploy su cluster gestiti in AWS, Azure e Google Cloud - Machine learning applicato con MLlib, Delta Lake e Databricks - Automazione delle routine, monitoraggio e scalabilità per Big DataAl termine, il lettore padroneggerà Apache Spark come soluzione professionale per l'analisi dei dati, l'automazione dei processi e il machine learning in ambienti complessi, distribuiti e ad alte prestazioni.
AmazonPagina's: 234, Paperback, Independently published
Prijzen voor het laatst bijgewerkt op: