Algoritmo K Means parallelo basato su Hadoop MapReduce per il data mining

Edizioni Sapienza
Algoritmo K Means parallelo basato su Hadoop MapReduce per il data mining

Afbeelding van Algoritmo K Means parallelo basato su Hadoop MapReduce per il data mining

Prijzen vanaf

12,48

Uitgelicht

	12,48	Naar shop
	12,48	Naar shop
	39,90	Naar shop

Beschrijving

Bol Questo lavoro aveva come obiettivo quello di studiare l'utilizzo di un algoritmo di raggruppamento K-Means parallelo, basato sul modello di programmazione MapReduce, per migliorare i tempi di risposta del data mining. Le prestazioni dell'algoritmo sono state valutate in termini di SpeedUp e ScaleUp. A tal fine sono stati eseguiti esperimenti su un cluster Hadoop composto da sei computer con hardware comune. I dati raggruppati sono misurazioni delle torri di flusso delle regioni agricole e appartengono ad Ameriflux. Gli esperimenti sono stati eseguiti utilizzando rispettivamente 3, 4 e 6 macchine. I risultati hanno mostrato che con l'aumento del numero di macchine si è ottenuto un miglioramento delle prestazioni, con il miglior tempo ottenuto utilizzando sei macchine, raggiungendo uno SpeedUp di 3,25. È stato verificato che l'applicazione scala bene con l'aumento equivalente della dimensione dei dati e del numero di macchine nel cluster, raggiungendo prestazioni simili nei test.

Lees meer

Vergelijk aanbieders (3)

Shop

Prijs

Verzendkosten

Totale prijs

12,48

Gratis

12,48

Naar shop

Gratis

12,48

Gratis

12,48

Naar shop

Gratis

39,90

Gratis

39,90

Naar shop

Gratis

Beschrijving (2)

Bol

Questo lavoro aveva come obiettivo quello di studiare l'utilizzo di un algoritmo di raggruppamento K-Means parallelo, basato sul modello di programmazione MapReduce, per migliorare i tempi di risposta del data mining. Le prestazioni dell'algoritmo sono state valutate in termini di SpeedUp e ScaleUp. A tal fine sono stati eseguiti esperimenti su un cluster Hadoop composto da sei computer con hardware comune. I dati raggruppati sono misurazioni delle torri di flusso delle regioni agricole e appartengono ad Ameriflux. Gli esperimenti sono stati eseguiti utilizzando rispettivamente 3, 4 e 6 macchine. I risultati hanno mostrato che con l'aumento del numero di macchine si è ottenuto un miglioramento delle prestazioni, con il miglior tempo ottenuto utilizzando sei macchine, raggiungendo uno SpeedUp di 3,25. È stato verificato che l'applicazione scala bene con l'aumento equivalente della dimensione dei dati e del numero di macchine nel cluster, raggiungendo prestazioni simili nei test.

Amazon

Pagina's: 56, Paperback, Edizioni Sapienza

Lees meer