Deduplicazione efficiente dei dati in Hadoop

Prijzen vanaf
9,54

Uitgelicht

VERGELIJK ALLE AANBIEDERS (3)

Beschrijving

Bol Hadoop è ampiamente utilizzato per l'archiviazione di dati distribuiti su larga scala. Sebbene sia altamente tollerante ai guasti, scalabile e funzionante su hardware standard, non fornisce una soluzione di archiviazione dati efficiente e ottimizzata. Quando un utente carica file con lo stesso contenuto su Hadoop, tutti i file vengono archiviati su HDFS (Hadoop Distributed File System) anche se il contenuto è identico, il che porta alla duplicazione dei contenuti e quindi a uno spreco di spazio di archiviazione. La deduplicazione dei dati è un processo che consente di ridurre la capacità di archiviazione richiesta, poiché vengono memorizzate solo le istanze uniche dei dati. Il processo di deduplicazione dei dati è ampiamente utilizzato nei file server, nei sistemi di gestione dei database, nell'archiviazione di backup e in molte altre soluzioni di archiviazione. Una strategia di deduplicazione adeguata utilizza in modo ottimale lo spazio di archiviazione disponibile nei dispositivi di archiviazione limitati. Hadoop non fornisce una soluzione di deduplicazione dei dati. In questo lavoro, il modulo di deduplicazione è stato integrato nel framework Hadoop per ottenere un'archiviazione dei dati ottimizzata.

Vergelijk aanbieders (3)

Shop
Prijs
Verzendkosten
Totale prijs
9,54
Gratis
9,54
Naar shop
Gratis Shipping Costs
9,54
Gratis
9,54
Naar shop
Gratis Shipping Costs
39,99
Gratis
39,99
Naar shop
Gratis Shipping Costs
Beschrijving (2)
Bol

Hadoop è ampiamente utilizzato per l'archiviazione di dati distribuiti su larga scala. Sebbene sia altamente tollerante ai guasti, scalabile e funzionante su hardware standard, non fornisce una soluzione di archiviazione dati efficiente e ottimizzata. Quando un utente carica file con lo stesso contenuto su Hadoop, tutti i file vengono archiviati su HDFS (Hadoop Distributed File System) anche se il contenuto è identico, il che porta alla duplicazione dei contenuti e quindi a uno spreco di spazio di archiviazione. La deduplicazione dei dati è un processo che consente di ridurre la capacità di archiviazione richiesta, poiché vengono memorizzate solo le istanze uniche dei dati. Il processo di deduplicazione dei dati è ampiamente utilizzato nei file server, nei sistemi di gestione dei database, nell'archiviazione di backup e in molte altre soluzioni di archiviazione. Una strategia di deduplicazione adeguata utilizza in modo ottimale lo spazio di archiviazione disponibile nei dispositivi di archiviazione limitati. Hadoop non fornisce una soluzione di deduplicazione dei dati. In questo lavoro, il modulo di deduplicazione è stato integrato nel framework Hadoop per ottenere un'archiviazione dei dati ottimizzata.

Amazon

Pagina's: 76, Paperback, Edizioni Sapienza


Productspecificaties

Merk Edizioni Sapienza
EAN
  • 9786202087407
Maat


Prijshistorie

* Prijshistorie bevat geen data van Amazon, Amazon Marketplace.

Prijzen voor het laatst bijgewerkt op:

Uitgelichte Keuze
9,54
Naar shop