Revert "handle empty partition-by expr list as RoundRobin"

This reverts commit 66b192d
apache · adrian-ionescu · Nov 27, 2017 · Nov 27, 2017 · Nov 27, 2017 · Nov 28, 2017
commit f6cd38873e06380faf4dfb771b3839c68278996c
diff --git a/...st/src/main/scala/org/apache/spark/sql/catalyst/plans/logical/basicLogicalOperators.scala b/...st/src/main/scala/org/apache/spark/sql/catalyst/plans/logical/basicLogicalOperators.scala
@@ -23,7 +23,7 @@ import org.apache.spark.sql.catalyst.expressions._
 import org.apache.spark.sql.catalyst.expressions.aggregate.AggregateExpression
 import org.apache.spark.sql.catalyst.plans._
 import org.apache.spark.sql.catalyst.plans.logical.statsEstimation._
-import org.apache.spark.sql.catalyst.plans.physical.{HashPartitioning, Partitioning, RangePartitioning, RoundRobinPartitioning}
+import org.apache.spark.sql.catalyst.plans.physical.{HashPartitioning, Partitioning, RangePartitioning}
 import org.apache.spark.sql.types._
 import org.apache.spark.util.Utils
 import org.apache.spark.util.random.RandomSampler
@@ -839,6 +839,8 @@ case class RepartitionByExpression(
 
   require(numPartitions > 0, s"Number of partitions ($numPartitions) must be positive.")
 
+  require(partitionExpressions.nonEmpty, "At least one partition-by expression must be specified.")
+
   val partitioning: Partitioning = {
     val (sortOrder, nonSortOrder) = partitionExpressions.partition(_.isInstanceOf[SortOrder])
 
@@ -853,13 +855,8 @@ case class RepartitionByExpression(
 
     if (sortOrder.nonEmpty) {
       RangePartitioning(sortOrder.map(_.asInstanceOf[SortOrder]), numPartitions)
-    } else if (nonSortOrder.nonEmpty) {
-      HashPartitioning(nonSortOrder, numPartitions)
     } else {
-      // TODO: Use this to replace Repartition(shuffle = true)
-      // That way we can rename Repartition(shuffle = false) to Coalesce and
-      // RepartitionByExpression to Repartition
-      RoundRobinPartitioning(numPartitions)
+      HashPartitioning(nonSortOrder, numPartitions)
     }
   }
 

diff --git a/sql/catalyst/src/test/scala/org/apache/spark/sql/catalyst/analysis/AnalysisSuite.scala b/sql/catalyst/src/test/scala/org/apache/spark/sql/catalyst/analysis/AnalysisSuite.scala
@@ -536,6 +536,9 @@ class AnalysisSuite extends AnalysisTest with Matchers {
     intercept[IllegalArgumentException] {
       checkPartitioning(numPartitions = -1, exprs = Literal(20))
     }
+    intercept[IllegalArgumentException] {
+      checkPartitioning(numPartitions = 10, exprs = Seq.empty: _*)
+    }
     intercept[IllegalArgumentException] {
       checkPartitioning(numPartitions = 10, exprs = SortOrder('a.attr, Ascending), 'b.attr)
     }

diff --git a/sql/core/src/test/scala/org/apache/spark/sql/DataFrameSuite.scala b/sql/core/src/test/scala/org/apache/spark/sql/DataFrameSuite.scala
@@ -356,10 +356,6 @@ class DataFrameSuite extends QueryTest with SharedSQLContext {
     checkAnswer(
       testData.select('key).repartition(10).select('key),
       testData.select('key).collect().toSeq)
-
-    checkAnswer(
-      testData.select('key).repartition(10).select(spark_partition_id(), 'key),
-      testData.select('key).repartition(10, Seq.empty: _*).select(spark_partition_id(), 'key))
   }
 
   test("repartition with SortOrder") {
@@ -399,13 +395,6 @@ class DataFrameSuite extends QueryTest with SharedSQLContext {
         .select(spark_partition_id().as("id"), $"a", $"b"),
       data2d.toDF("a", "b").repartitionByRange(data2d.size, $"a".desc, $"b".asc)
         .select(spark_partition_id().as("id"), $"a", $"b"))
-
-    // .repartitionByRange() with no partition-by expressions behaves the same as .repartition()
-    checkAnswer(
-      data2d.toDF("a", "b").repartitionByRange(data2d.size, Seq.empty: _*)
-        .select(spark_partition_id().as("id"), $"a", $"b"),
-      data2d.toDF("a", "b").repartition(data2d.size)
-        .select(spark_partition_id().as("id"), $"a", $"b"))
   }
 
   test("coalesce") {