[SPARK-5365][MLlib] Refactor KMeans to reduce redundant data #4159

viirya · 2015-01-22T09:05:36Z

If a point is selected as new centers for many runs, it would collect many redundant data. This pr refactors it.

srowen · 2015-01-22T10:06:04Z

So this returns (p, (r1, r2, r3, ...)) instead of (r1, p), (r2, p), (r3, p), ... Makes sense to me, especially if you have reason to believe this is a bottleneck somewhere.

viirya · 2015-01-22T10:10:11Z

Especially when there are many runs to use and p is also high dimensional and selected in more than one run. Then collecting redundant p would be too useless and time-consuming.

SparkQA · 2015-01-22T10:13:53Z

Test build #25962 has finished for PR 4159 at commit 25487e6.

This patch passes all tests.
This patch merges cleanly.
This patch adds no public classes.

mengxr · 2015-01-22T16:17:25Z

LGTM. Merged into master. Thanks!

Refactor codes to reduce redundant data.

25487e6

viirya changed the title ~~Refactor KMeans to reduce redundant data~~ [SPARK-5365][MLlib] Refactor KMeans to reduce redundant data Jan 22, 2015

asfgit closed this in 246111d Jan 22, 2015

viirya deleted the small_refactor_kmeans branch December 27, 2023 18:30

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[SPARK-5365][MLlib] Refactor KMeans to reduce redundant data #4159

[SPARK-5365][MLlib] Refactor KMeans to reduce redundant data #4159

Uh oh!

viirya commented Jan 22, 2015

Uh oh!

srowen commented Jan 22, 2015

Uh oh!

viirya commented Jan 22, 2015

Uh oh!

SparkQA commented Jan 22, 2015

Uh oh!

mengxr commented Jan 22, 2015

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants

[SPARK-5365][MLlib] Refactor KMeans to reduce redundant data #4159

[SPARK-5365][MLlib] Refactor KMeans to reduce redundant data #4159

Uh oh!

Conversation

viirya commented Jan 22, 2015

Uh oh!

srowen commented Jan 22, 2015

Uh oh!

viirya commented Jan 22, 2015

Uh oh!

SparkQA commented Jan 22, 2015

Uh oh!

mengxr commented Jan 22, 2015

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants