Algorithme K Means parallèle basé sur Hadoop MapReduce pour l'exploration de données
Uitgelicht
|
39,75 |
Naar shop
|
|
39,75 |
Naar shop
|
|
39,90 |
Naar shop
|
Beschrijving
Bol
Ce travail avait pour objectif d'étudier l'utilisation d'un algorithme de regroupement K-Means parallèle, basé sur le modèle de programmation MapReduce, afin d'améliorer le temps de réponse de l'exploration de données. Les performances de l'algorithme ont été évaluées en termes de SpeedUp et ScaleUp. Pour cela, des expériences ont été menées sur un cluster Hadoop composé de six ordinateurs à matériel standard. Les données regroupées sont des mesures de flux provenant de tours situées dans des régions agricoles et appartiennent à Ameriflux. Les expériences ont été menées à l'aide de 3, 4 et 6 machines, respectivement. Les résultats ont montré qu'avec l'augmentation du nombre de machines, les performances ont été améliorées, le meilleur temps ayant été obtenu avec six machines, atteignant un SpeedUp de 3,25. Il a été constaté que l'application s'adapte bien à l'augmentation équivalente de la taille des données et du nombre de machines dans le cluster, atteignant des performances similaires lors des tests.
Ce travail avait pour objectif d'étudier l'utilisation d'un algorithme de regroupement K-Means parallèle, basé sur le modèle de programmation MapReduce, afin d'améliorer le temps de réponse de l'exploration de données. Les performances de l'algorithme ont été évaluées en termes de SpeedUp et ScaleUp. Pour cela, des expériences ont été menées sur un cluster Hadoop composé de six ordinateurs à matériel standard. Les données regroupées sont des mesures de flux provenant de tours situées dans des régions agricoles et appartiennent à Ameriflux. Les expériences ont été menées à l'aide de 3, 4 et 6 machines, respectivement. Les résultats ont montré qu'avec l'augmentation du nombre de machines, les performances ont été améliorées, le meilleur temps ayant été obtenu avec six machines, atteignant un SpeedUp de 3,25. Il a été constaté que l'application s'adapte bien à l'augmentation équivalente de la taille des données et du nombre de machines dans le cluster, atteignant des performances similaires lors des tests.
AmazonPagina's: 60, Paperback, Editions Notre Savoir
Prijshistorie
* Prijshistorie bevat geen data van Amazon, Amazon Marketplace.
Prijzen voor het laatst bijgewerkt op: