IMPARA APACHE SPARK: Costruisci Pipeline Scalabili con PySpark e Ottimizzazione: 2

Independently Published
IMPARA APACHE SPARK: Costruisci Pipeline Scalabili con PySpark e Ottimizzazione: 2

Afbeelding van IMPARA APACHE SPARK: Costruisci Pipeline Scalabili con PySpark e Ottimizzazione: 2

Prijzen vanaf

15,90

Uitgelicht

	15,90	Naar shop
	15,94	Naar shop
	15,94	Naar shop

Beschrijving

Bol IMPARA APACHE SPARK Costruisci Pipeline Scalabili con PySpark e OttimizzazioneQuesto libro è rivolto a studenti, sviluppatori, ingegneri dei dati, data scientist e professionisti IT che desiderano padroneggiare Apache Spark nella pratica, in ambienti aziendali, cloud pubblici e integrazioni moderne. Il lettore imparerà a progettare, implementare e gestire pipeline scalabili per l'elaborazione di dati su larga scala, orchestrando workload distribuiti su AWS EMR, Databricks, Azure Synapse e Google Cloud Dataproc.Il contenuto copre l'integrazione con Hadoop, Hive, Kafka, SQL, Delta Lake, MongoDB e Python, oltre a tecniche avanzate di tuning, ottimizzazione dei job, analisi in tempo reale, machine learning con MLlib e automazione dei workflow orientati alla produzione.Include: - Implementazione di pipeline ETL ed ELT con Spark SQL e DataFrame - Elaborazione di dati in streaming e integrazione con Kafka e AWS Kinesis - Ottimizzazione dei job distribuiti, tuning delle prestazioni e utilizzo della Spark UI - Integrazione di Spark con S3, Data Lake, NoSQL e database relazionali - Deploy su cluster gestiti in AWS, Azure e Google Cloud - Machine learning applicato con MLlib, Delta Lake e Databricks - Automazione delle routine, monitoraggio e scalabilità per Big DataAl termine, il lettore padroneggerà Apache Spark come soluzione professionale per l'analisi dei dati, l'automazione dei processi e il machine learning in ambienti complessi, distribuiti e ad alte prestazioni.

Lees meer

Vergelijk aanbieders (3)

Shop

Prijs

Verzendkosten

Totale prijs

15,90

2,99

18,89

Naar shop

2,99

15,94

Gratis

15,94

Naar shop

Gratis

15,94

Gratis

15,94

Naar shop

Gratis

Beschrijving (2)

Bol

IMPARA APACHE SPARK Costruisci Pipeline Scalabili con PySpark e OttimizzazioneQuesto libro è rivolto a studenti, sviluppatori, ingegneri dei dati, data scientist e professionisti IT che desiderano padroneggiare Apache Spark nella pratica, in ambienti aziendali, cloud pubblici e integrazioni moderne. Il lettore imparerà a progettare, implementare e gestire pipeline scalabili per l'elaborazione di dati su larga scala, orchestrando workload distribuiti su AWS EMR, Databricks, Azure Synapse e Google Cloud Dataproc.Il contenuto copre l'integrazione con Hadoop, Hive, Kafka, SQL, Delta Lake, MongoDB e Python, oltre a tecniche avanzate di tuning, ottimizzazione dei job, analisi in tempo reale, machine learning con MLlib e automazione dei workflow orientati alla produzione.Include: - Implementazione di pipeline ETL ed ELT con Spark SQL e DataFrame - Elaborazione di dati in streaming e integrazione con Kafka e AWS Kinesis - Ottimizzazione dei job distribuiti, tuning delle prestazioni e utilizzo della Spark UI - Integrazione di Spark con S3, Data Lake, NoSQL e database relazionali - Deploy su cluster gestiti in AWS, Azure e Google Cloud - Machine learning applicato con MLlib, Delta Lake e Databricks - Automazione delle routine, monitoraggio e scalabilità per Big DataAl termine, il lettore padroneggerà Apache Spark come soluzione professionale per l'analisi dei dati, l'automazione dei processi e il machine learning in ambienti complessi, distribuiti e ad alte prestazioni.

Amazon

Pagina's: 234, Paperback, Independently published

Lees meer