Algoritmo K Means parallelo basato su Hadoop MapReduce per il data mining
Uitgelicht
|
12,48 |
Naar shop
|
|
12,48 |
Naar shop
|
|
39,90 |
Naar shop
|
Beschrijving
Bol
Questo lavoro aveva come obiettivo quello di studiare l'utilizzo di un algoritmo di raggruppamento K-Means parallelo, basato sul modello di programmazione MapReduce, per migliorare i tempi di risposta del data mining. Le prestazioni dell'algoritmo sono state valutate in termini di SpeedUp e ScaleUp. A tal fine sono stati eseguiti esperimenti su un cluster Hadoop composto da sei computer con hardware comune. I dati raggruppati sono misurazioni delle torri di flusso delle regioni agricole e appartengono ad Ameriflux. Gli esperimenti sono stati eseguiti utilizzando rispettivamente 3, 4 e 6 macchine. I risultati hanno mostrato che con l'aumento del numero di macchine si è ottenuto un miglioramento delle prestazioni, con il miglior tempo ottenuto utilizzando sei macchine, raggiungendo uno SpeedUp di 3,25. È stato verificato che l'applicazione scala bene con l'aumento equivalente della dimensione dei dati e del numero di macchine nel cluster, raggiungendo prestazioni simili nei test.
Questo lavoro aveva come obiettivo quello di studiare l'utilizzo di un algoritmo di raggruppamento K-Means parallelo, basato sul modello di programmazione MapReduce, per migliorare i tempi di risposta del data mining. Le prestazioni dell'algoritmo sono state valutate in termini di SpeedUp e ScaleUp. A tal fine sono stati eseguiti esperimenti su un cluster Hadoop composto da sei computer con hardware comune. I dati raggruppati sono misurazioni delle torri di flusso delle regioni agricole e appartengono ad Ameriflux. Gli esperimenti sono stati eseguiti utilizzando rispettivamente 3, 4 e 6 macchine. I risultati hanno mostrato che con l'aumento del numero di macchine si è ottenuto un miglioramento delle prestazioni, con il miglior tempo ottenuto utilizzando sei macchine, raggiungendo uno SpeedUp di 3,25. È stato verificato che l'applicazione scala bene con l'aumento equivalente della dimensione dei dati e del numero di macchine nel cluster, raggiungendo prestazioni simili nei test.
AmazonPagina's: 56, Paperback, Edizioni Sapienza
Prijzen voor het laatst bijgewerkt op: