IMPARA APACHE SPARK: Costruisci Pipeline Scalabili con PySpark e Ottimizzazione: 2

Prijzen vanaf
15,90

Uitgelicht

VERGELIJK ALLE AANBIEDERS (3)

Beschrijving

Bol IMPARA APACHE SPARK Costruisci Pipeline Scalabili con PySpark e OttimizzazioneQuesto libro è rivolto a studenti, sviluppatori, ingegneri dei dati, data scientist e professionisti IT che desiderano padroneggiare Apache Spark nella pratica, in ambienti aziendali, cloud pubblici e integrazioni moderne. Il lettore imparerà a progettare, implementare e gestire pipeline scalabili per l'elaborazione di dati su larga scala, orchestrando workload distribuiti su AWS EMR, Databricks, Azure Synapse e Google Cloud Dataproc.Il contenuto copre l'integrazione con Hadoop, Hive, Kafka, SQL, Delta Lake, MongoDB e Python, oltre a tecniche avanzate di tuning, ottimizzazione dei job, analisi in tempo reale, machine learning con MLlib e automazione dei workflow orientati alla produzione.Include: - Implementazione di pipeline ETL ed ELT con Spark SQL e DataFrame - Elaborazione di dati in streaming e integrazione con Kafka e AWS Kinesis - Ottimizzazione dei job distribuiti, tuning delle prestazioni e utilizzo della Spark UI - Integrazione di Spark con S3, Data Lake, NoSQL e database relazionali - Deploy su cluster gestiti in AWS, Azure e Google Cloud - Machine learning applicato con MLlib, Delta Lake e Databricks - Automazione delle routine, monitoraggio e scalabilità per Big DataAl termine, il lettore padroneggerà Apache Spark come soluzione professionale per l'analisi dei dati, l'automazione dei processi e il machine learning in ambienti complessi, distribuiti e ad alte prestazioni.

Vergelijk aanbieders (3)

Shop
Prijs
Verzendkosten
Totale prijs
15,90
2,99
18,89
Naar shop
2,99 Shipping Costs
15,94
Gratis
15,94
Naar shop
Gratis Shipping Costs
15,94
Gratis
15,94
Naar shop
Gratis Shipping Costs
Beschrijving (2)
Bol

IMPARA APACHE SPARK Costruisci Pipeline Scalabili con PySpark e OttimizzazioneQuesto libro è rivolto a studenti, sviluppatori, ingegneri dei dati, data scientist e professionisti IT che desiderano padroneggiare Apache Spark nella pratica, in ambienti aziendali, cloud pubblici e integrazioni moderne. Il lettore imparerà a progettare, implementare e gestire pipeline scalabili per l'elaborazione di dati su larga scala, orchestrando workload distribuiti su AWS EMR, Databricks, Azure Synapse e Google Cloud Dataproc.Il contenuto copre l'integrazione con Hadoop, Hive, Kafka, SQL, Delta Lake, MongoDB e Python, oltre a tecniche avanzate di tuning, ottimizzazione dei job, analisi in tempo reale, machine learning con MLlib e automazione dei workflow orientati alla produzione.Include: - Implementazione di pipeline ETL ed ELT con Spark SQL e DataFrame - Elaborazione di dati in streaming e integrazione con Kafka e AWS Kinesis - Ottimizzazione dei job distribuiti, tuning delle prestazioni e utilizzo della Spark UI - Integrazione di Spark con S3, Data Lake, NoSQL e database relazionali - Deploy su cluster gestiti in AWS, Azure e Google Cloud - Machine learning applicato con MLlib, Delta Lake e Databricks - Automazione delle routine, monitoraggio e scalabilità per Big DataAl termine, il lettore padroneggerà Apache Spark come soluzione professionale per l'analisi dei dati, l'automazione dei processi e il machine learning in ambienti complessi, distribuiti e ad alte prestazioni.

Amazon

Pagina's: 234, Paperback, Independently published


Productspecificaties

Merk Independently Published
EAN
  • 9798244696011
Maat

Prijzen voor het laatst bijgewerkt op:

Uitgelichte Keuze
15,90
Naar shop