apache · sarutak · Dec 18, 2020 · Dec 19, 2020 · Dec 19, 2020 · Dec 20, 2020
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/debug/package.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/debug/package.scala
@@ -107,12 +107,19 @@ package object debug {
    */
   def codegenStringSeq(plan: SparkPlan): Seq[(String, String, ByteCodeStats)] = {
     val codegenSubtrees = new collection.mutable.HashSet[WholeStageCodegenExec]()
-    plan transform {
-      case s: WholeStageCodegenExec =>
-        codegenSubtrees += s
-        s
-      case s => s
+
+    def findSubtrees(plan: SparkPlan): Unit = {
+      plan transform {
+        case s: WholeStageCodegenExec =>
+          codegenSubtrees += s
 val codegenSubtrees = new collection.mutable.HashSet[WholeStageCodegenExec]() 
 plan foreach { 
   case s: WholeStageCodegenExec => 
     codegenSubtrees += s 
   case _ => 
 } 
 val codegenSubtrees = new collection.mutable.HashSet[WholeStageCodegenExec]() 
 plan foreach { 
   case s: WholeStageCodegenExec => 
     codegenSubtrees += s 
   case _ => 
 } 
+          s
+        case s =>
+          s.subqueries.foreach(findSubtrees)
+          s
+      }
     }
+
+    findSubtrees(plan)
     codegenSubtrees.toSeq.sortBy(_.codegenStageId).map { subtree =>
       val (_, source) = subtree.doCodeGen()
       val codeStats = try {

diff --git a/sql/core/src/test/scala/org/apache/spark/sql/ExplainSuite.scala b/sql/core/src/test/scala/org/apache/spark/sql/ExplainSuite.scala
@@ -228,6 +228,25 @@ class ExplainSuite extends ExplainSuiteHelper with DisableAdaptiveExecutionSuite
     }
   }
 
+  test("SPARK-33853: explain codegen - check presence of subquery") {
+    withSQLConf(SQLConf.WHOLESTAGE_CODEGEN_ENABLED.key -> "true") {
+      withTable("df1") {
+        spark.range(1, 100)
+          .write
+          .format("parquet")
+          .mode("overwrite")
+          .saveAsTable("df1")
+
+        val sqlText = "EXPLAIN CODEGEN SELECT (SELECT min(id) FROM df1)"
+        val expectedText = "Found 3 WholeStageCodegen subtrees."
+
+        withNormalizedExplain(sqlText) { normalizedOutput =>
+          assert(normalizedOutput.contains(expectedText))
+        }
+      }
+    }
+  }
+
   test("explain formatted - check presence of subquery in case of DPP") {
     withTable("df1", "df2") {
       withSQLConf(SQLConf.DYNAMIC_PARTITION_PRUNING_ENABLED.key -> "true",