apache · mgaido91 · Sep 27, 2017 · Sep 27, 2017 · Sep 28, 2017 · dongjoon-hyun
diff --git a/sql/hive/src/main/scala/org/apache/spark/sql/hive/orc/OrcFileFormat.scala b/sql/hive/src/main/scala/org/apache/spark/sql/hive/orc/OrcFileFormat.scala
@@ -58,7 +58,7 @@ class OrcFileFormat extends FileFormat with DataSourceRegister with Serializable
       options: Map[String, String],
       files: Seq[FileStatus]): Option[StructType] = {
     OrcFileOperator.readSchema(
-      files.map(_.getPath.toUri.toString),
+      files.map(_.getPath.toString),
       Some(sparkSession.sessionState.newHadoopConf())
     )
   }

diff --git a/sql/hive/src/test/scala/org/apache/spark/sql/hive/orc/OrcSourceSuite.scala b/sql/hive/src/test/scala/org/apache/spark/sql/hive/orc/OrcSourceSuite.scala
@@ -274,4 +274,16 @@ class OrcSourceSuite extends OrcSuite {
       )).get.toString
     }
   }
+
+  test("SPARK-22146: read ORC files containing special characters") {
+    val dir = Utils.createTempDir().getCanonicalFile
+    import spark.implicits._
+    try {
+      val nameWithSpecialChars = s"$dir/a%3Abad name.orc"
+      spark.createDataset(Seq("a", "b")).write.format("orc").save(nameWithSpecialChars)
+      spark.read.format("orc").load(nameWithSpecialChars)
+    } finally {
+      Utils.deleteRecursively(dir)
+    }
+  }
 }