[SPARK-16006][SQL] Attemping to write empty DataFrame with no fields …

…throw non-intuitive exception
apache · dongjoon-hyun · Jun 17, 2016 · Jun 17, 2016 · Jun 28, 2016 · c4458d46fa9a2859f9ef5111ce0b53234c19d7b1
commit c4458d46fa9a2859f9ef5111ce0b53234c19d7b1
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/datasources/PartitioningUtils.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/datasources/PartitioningUtils.scala
@@ -339,6 +339,9 @@ private[sql] object PartitioningUtils {
   private val upCastingOrder: Seq[DataType] =
     Seq(NullType, IntegerType, LongType, FloatType, DoubleType, StringType)
 
+  /**
+   * Validate partition columns for writing executions.
+   */
   def validatePartitionColumn(
       schema: StructType,
       partitionColumns: Seq[String],
@@ -351,8 +354,10 @@ private[sql] object PartitioningUtils {
       }
     }
 
-    if (partitionColumns.size == schema.fields.size) {
-      throw new AnalysisException(s"Cannot use all columns for partition columns")
+    if (schema.fields.isEmpty) {
+      throw new AnalysisException("Cannot write dataset with no fields")
+    } else if (partitionColumns.size == schema.fields.length) {
+      throw new AnalysisException("Cannot use all columns for partition columns")
     }
   }
 

diff --git a/sql/core/src/test/scala/org/apache/spark/sql/test/DataFrameReaderWriterSuite.scala b/sql/core/src/test/scala/org/apache/spark/sql/test/DataFrameReaderWriterSuite.scala
@@ -214,12 +214,18 @@ class DataFrameReaderWriterSuite extends QueryTest with SharedSQLContext with Be
   test("prevent all column partitioning") {
     withTempDir { dir =>
       val path = dir.getCanonicalPath
-      intercept[AnalysisException] {
+      var e = intercept[AnalysisException] {
+        spark.emptyDataFrame.write.format("text").mode("overwrite").save(path)
+      }
+      assert(e.getMessage.contains("Cannot write dataset with no fields"))
+      e = intercept[AnalysisException] {
         spark.range(10).write.format("parquet").mode("overwrite").partitionBy("id").save(path)
       }
-      intercept[AnalysisException] {
-        spark.range(10).write.format("orc").mode("overwrite").partitionBy("id").save(path)
+      assert(e.getMessage.contains("Cannot use all columns for partition columns"))
+      e = intercept[AnalysisException] {
+        spark.range(10).write.format("csv").mode("overwrite").partitionBy("id").save(path)
       }
+      assert(e.getMessage.contains("Cannot use all columns for partition columns"))
     }
   }