Fix

apache · maropu · Aug 23, 2018 · Aug 25, 2018 · Aug 26, 2018 · Aug 27, 2018
commit a6e4e40ad039fa3dcc522c628ace2968e62ade4c
diff --git a/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/analysis/Analyzer.scala b/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/analysis/Analyzer.scala
@@ -146,7 +146,7 @@ class Analyzer(
 
   lazy val batches: Seq[Batch] = Seq(
     Batch("Hints", fixedPoint,
-      new ResolveHints.ResolveBroadcastHints(conf),
+      new ResolveHints.ResolveBroadcastHints(conf, catalog),
       ResolveHints.ResolveCoalesceHints,
       ResolveHints.RemoveAllHints),
     Batch("Simple Sanity Check", Once,

diff --git a/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/analysis/ResolveHints.scala b/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/analysis/ResolveHints.scala
@@ -21,6 +21,7 @@ import java.util.Locale
 
 import org.apache.spark.sql.AnalysisException
 import org.apache.spark.sql.catalyst.IdentifierWithDatabase
+import org.apache.spark.sql.catalyst.catalog.SessionCatalog
 import org.apache.spark.sql.catalyst.expressions.IntegerLiteral
 import org.apache.spark.sql.catalyst.plans.logical._
 import org.apache.spark.sql.catalyst.rules.Rule
@@ -48,16 +49,25 @@ object ResolveHints {
    *
    * This rule must happen before common table expressions.
    */
-  class ResolveBroadcastHints(conf: SQLConf) extends Rule[LogicalPlan] {
+  class ResolveBroadcastHints(conf: SQLConf, catalog: SessionCatalog) extends Rule[LogicalPlan] {
     private val BROADCAST_HINT_NAMES = Set("BROADCAST", "BROADCASTJOIN", "MAPJOIN")
 
     def resolver: Resolver = conf.resolver
 
+    private def namePartsWithDatabase(nameParts: Seq[String]): Seq[String] = {
+      if (nameParts.size == 1) {
+        catalog.getCurrentDatabase +: nameParts
+      } else {
+        nameParts
+      }
+    }
+
     private def matchedTableIdentifier(
         nameParts: Seq[String],
         tableIdent: IdentifierWithDatabase): Boolean = {
-      val identifierList = tableIdent.database.map(_ :: Nil).getOrElse(Nil) :+ tableIdent.identifier
-      nameParts.corresponds(identifierList)(resolver)
+      val identifierList =
+        tableIdent.database.getOrElse(catalog.getCurrentDatabase) :: tableIdent.identifier :: Nil
+      namePartsWithDatabase(nameParts).corresponds(identifierList)(resolver)
     }
 
     private def applyBroadcastHint(

diff --git a/sql/core/src/test/scala/org/apache/spark/sql/DataFrameJoinSuite.scala b/sql/core/src/test/scala/org/apache/spark/sql/DataFrameJoinSuite.scala
@@ -196,33 +196,42 @@ class DataFrameJoinSuite extends QueryTest with SharedSQLContext {
   }
 
   test("SPARK-25121 Supports multi-part names for broadcast hint resolution") {
-    val tableName = "t"
+    val (table1Name, table2Name) = ("t1", "t2")
     withTempDatabase { dbName =>
-      withTable(tableName) {
+      withTable(table1Name, table2Name) {
         withSQLConf(SQLConf.AUTO_BROADCASTJOIN_THRESHOLD.key -> "0") {
-          spark.range(100).write.saveAsTable(s"$dbName.$tableName")
+          spark.range(50).write.saveAsTable(s"$dbName.$table1Name")
+          spark.range(100).write.saveAsTable(s"$dbName.$table2Name")
           // First, makes sure a join is not broadcastable
-          val plan1 = spark.range(3)
-            .join(spark.table(s"$dbName.$tableName"), "id")
+          val plan = sql(s"SELECT * FROM $dbName.$table1Name, $dbName.$table2Name " +
+              s"WHERE $table1Name.id = $table2Name.id")
             .queryExecution.executedPlan
-          assert(plan1.collect { case p: BroadcastHashJoinExec => p }.size == 0)
+          assert(plan.collect { case p: BroadcastHashJoinExec => p }.size == 0)
 
           // Uses multi-part table names for broadcast hints
-          val plan2 = spark.range(3)
-            .join(spark.table(s"$dbName.$tableName"), "id")
-            .hint("broadcast", s"$dbName.$tableName")
-            .queryExecution.executedPlan
-          val broadcastHashJoin = plan2.collect { case p: BroadcastHashJoinExec => p }
-          assert(broadcastHashJoin.size == 1)
-          val broadcastExchange = broadcastHashJoin.head.collect {
-            case p: BroadcastExchangeExec => p
-          }
-          assert(broadcastExchange.size == 1)
-          val table = broadcastExchange.head.collect {
-            case FileSourceScanExec(_, _, _, _, _, _, Some(tableIdent)) => tableIdent
+          def checkIfHintApplied(tableName: String, hintTableName: String): Unit = {
+            val p = sql(s"SELECT /*+ BROADCASTJOIN($tableName) */ * " +
+                s"FROM $tableName, $dbName.$table2Name " +
+                s"WHERE $tableName.id = $table2Name.id")
+              .queryExecution.executedPlan
+            val broadcastHashJoin = p.collect { case p: BroadcastHashJoinExec => p }
+            assert(broadcastHashJoin.size == 1)
+            val broadcastExchange = broadcastHashJoin.head.collect {
+              case p: BroadcastExchangeExec => p
+            }
+            assert(broadcastExchange.size == 1)
+            val table = broadcastExchange.head.collect {
+              case FileSourceScanExec(_, _, _, _, _, _, Some(tableIdent)) => tableIdent
+            }
+            assert(table.size == 1)
+            assert(table.head === TableIdentifier(table1Name, Some(dbName)))
           }
-          assert(table.size == 1)
-          assert(table.head === TableIdentifier(tableName, Some(dbName)))
+
+          sql(s"USE $dbName")
+          checkIfHintApplied(table1Name, table1Name)
+          checkIfHintApplied(s"$dbName.$table1Name", s"$dbName.$table1Name")
+          checkIfHintApplied(table1Name, s"$dbName.$table1Name")
+          checkIfHintApplied(s"$dbName.$table1Name", table1Name)
         }
       }
     }