update docs

apache · adrian-ionescu · Nov 27, 2017 · Nov 27, 2017 · Nov 27, 2017 · Nov 28, 2017
commit 012d617430befd8b028562c4d8f7b49cf8776659
diff --git a/...st/src/main/scala/org/apache/spark/sql/catalyst/plans/logical/basicLogicalOperators.scala b/...st/src/main/scala/org/apache/spark/sql/catalyst/plans/logical/basicLogicalOperators.scala
@@ -846,10 +846,10 @@ case class RepartitionByExpression(
       s"${getClass.getSimpleName} expects that either all its `partitionExpressions` are of type " +
         "`SortOrder`, which means `RangePartitioning`, or none of them are `SortOrder`, which " +
         "means `HashPartitioning`. In this case we have:" +
-      s""""
-          |SortOrder: ${sortOrder}
-          |NonSortOrder: ${nonSortOrder}
-        """.stripMargin)
+      s"""
+         |SortOrder: ${sortOrder}
+         |NonSortOrder: ${nonSortOrder}
+       """.stripMargin)
 
     if (sortOrder.nonEmpty) {
       RangePartitioning(sortOrder.map(_.asInstanceOf[SortOrder]), numPartitions)

diff --git a/sql/core/src/main/scala/org/apache/spark/sql/Dataset.scala b/sql/core/src/main/scala/org/apache/spark/sql/Dataset.scala
@@ -2723,8 +2723,8 @@ class Dataset[T] private[sql](
   }
 
   /**
-   * Returns a new Dataset partitioned by the given partitioning expressions into
-   * `numPartitions`. The resulting Dataset is hash partitioned.
+   * Returns a new Dataset that is hash partitioned by the given expressions into `numPartitions`.
+   * If no expressions are specified, round robin partitioning is used.
    *
    * This is the same operation as "DISTRIBUTE BY" in SQL (Hive QL).
    *
@@ -2745,9 +2745,9 @@ class Dataset[T] private[sql](
   }
 
   /**
-   * Returns a new Dataset partitioned by the given partitioning expressions, using
-   * `spark.sql.shuffle.partitions` as number of partitions.
-   * The resulting Dataset is hash partitioned.
+   * Returns a new Dataset that is hash partitioned by the given expressions, using
+   * `spark.sql.shuffle.partitions` as the number of partitions. If no expressions are specified,
+   * round robin partitioning is used.
    *
    * This is the same operation as "DISTRIBUTE BY" in SQL (Hive QL).
    *
@@ -2760,8 +2760,8 @@ class Dataset[T] private[sql](
   }
 
   /**
-   * Returns a new Dataset partitioned by the given partitioning expressions into
-   * `numPartitions`. The resulting Dataset is range partitioned.
+   * Returns a new Dataset that is hash partitioned by the given expressions into `numPartitions`.
+   * If no expressions are specified, round robin partitioning is used.
    *
    * @group typedrel
    * @since 2.3.0
@@ -2780,9 +2780,9 @@ class Dataset[T] private[sql](
   }
 
   /**
-   * Returns a new Dataset partitioned by the given partitioning expressions, using
-   * `spark.sql.shuffle.partitions` as number of partitions.
-   * The resulting Dataset is range partitioned.
+   * Returns a new Dataset that is range partitioned by the given expressions, using
+   * `spark.sql.shuffle.partitions` as the number of partitions. If no expressions are specified,
+   * round robin partitioning is used.
    *
    * @group typedrel
    * @since 2.3.0