CLN: revise comment

apache · facaiy · Jul 6, 2017 · Jul 6, 2017 · Jul 6, 2017 · Jul 7, 2017
commit 00a7ed82cee5a9f2eb5f819e1177f480d9cb8f58
diff --git a/mllib/src/main/scala/org/apache/spark/ml/classification/OneVsRest.scala b/mllib/src/main/scala/org/apache/spark/ml/classification/OneVsRest.scala
@@ -323,7 +323,6 @@ final class OneVsRest @Since("1.4.0") (
     val numClasses = MetadataUtils.getNumClasses(labelSchema).fold(computeNumClasses())(identity)
     instr.logNumClasses(numClasses)
 
-    // SPARK-21306: cache weightCol if necessary
     val weightColIsUsed = isDefined(weightCol) && $(weightCol).nonEmpty && {
       getClassifier match {
         case _: HasWeightCol => true

diff --git a/mllib/src/test/scala/org/apache/spark/ml/classification/OneVsRestSuite.scala b/mllib/src/test/scala/org/apache/spark/ml/classification/OneVsRestSuite.scala
@@ -156,10 +156,9 @@ class OneVsRestSuite extends SparkFunSuite with MLlibTestSparkContext with Defau
     assert(output.schema.fieldNames.toSet === Set("label", "features", "prediction"))
   }
 
-  test("SPARK-21306: OneVsRest should cache weightCol if necessary") {
+  test("SPARK-21306: OneVsRest should support setWeightCol") {
     val dataset2 = dataset.withColumn("weight", lit(1))
     val ova = new OneVsRest().setWeightCol("weight").setClassifier(new LogisticRegression())
-    // failed if weightCol is not cached.
     val ovaModel = ova.fit(dataset2)
     assert(ovaModel !== null)
   }

diff --git a/python/pyspark/ml/classification.py b/python/pyspark/ml/classification.py
@@ -1548,7 +1548,6 @@ def _fit(self, dataset):
 
         numClasses = int(dataset.agg({labelCol: "max"}).head()["max("+labelCol+")"]) + 1
 
-        # SPARK - 21306: cache weightCol if necessary
         weightCol = None
         if (self.isDefined(self.weightCol) and self.getWeightCol()):
             if isinstance(classifier, HasWeightCol):