Algorithme K Means parallèle basé sur Hadoop MapReduce pour l'exploration de données

Editions Notre Savoir
Algorithme K Means parallèle basé sur Hadoop MapReduce pour l'exploration de données

Afbeelding van Algorithme K Means parallèle basé sur Hadoop MapReduce pour l'exploration de données

Prijzen vanaf

39,75

Uitgelicht

	39,75	Naar shop
	39,75	Naar shop
	39,90	Naar shop

Beschrijving

Bol Ce travail avait pour objectif d'étudier l'utilisation d'un algorithme de regroupement K-Means parallèle, basé sur le modèle de programmation MapReduce, afin d'améliorer le temps de réponse de l'exploration de données. Les performances de l'algorithme ont été évaluées en termes de SpeedUp et ScaleUp. Pour cela, des expériences ont été menées sur un cluster Hadoop composé de six ordinateurs à matériel standard. Les données regroupées sont des mesures de flux provenant de tours situées dans des régions agricoles et appartiennent à Ameriflux. Les expériences ont été menées à l'aide de 3, 4 et 6 machines, respectivement. Les résultats ont montré qu'avec l'augmentation du nombre de machines, les performances ont été améliorées, le meilleur temps ayant été obtenu avec six machines, atteignant un SpeedUp de 3,25. Il a été constaté que l'application s'adapte bien à l'augmentation équivalente de la taille des données et du nombre de machines dans le cluster, atteignant des performances similaires lors des tests.

Lees meer

Vergelijk aanbieders (3)

Shop

Prijs

Verzendkosten

Totale prijs

39,75

Gratis

39,75

Naar shop

Gratis

39,75

Gratis

39,75

Naar shop

Gratis

39,90

Gratis

39,90

Naar shop

Gratis

Beschrijving (2)

Bol

Ce travail avait pour objectif d'étudier l'utilisation d'un algorithme de regroupement K-Means parallèle, basé sur le modèle de programmation MapReduce, afin d'améliorer le temps de réponse de l'exploration de données. Les performances de l'algorithme ont été évaluées en termes de SpeedUp et ScaleUp. Pour cela, des expériences ont été menées sur un cluster Hadoop composé de six ordinateurs à matériel standard. Les données regroupées sont des mesures de flux provenant de tours situées dans des régions agricoles et appartiennent à Ameriflux. Les expériences ont été menées à l'aide de 3, 4 et 6 machines, respectivement. Les résultats ont montré qu'avec l'augmentation du nombre de machines, les performances ont été améliorées, le meilleur temps ayant été obtenu avec six machines, atteignant un SpeedUp de 3,25. Il a été constaté que l'application s'adapte bien à l'augmentation équivalente de la taille des données et du nombre de machines dans le cluster, atteignant des performances similaires lors des tests.

Amazon

Pagina's: 60, Paperback, Editions Notre Savoir

Lees meer