assert adjustedTargetExecutors == 1

apache · zhouyifan279 · Aug 9, 2023 · Aug 14, 2023 · Aug 15, 2023 · Aug 15, 2023
commit c4403eefa6c80bab4a160b747a756329b1193307
diff --git a/...bi-extension-spark-3-3/src/main/scala/org/apache/kyuubi/sql/KyuubiSparkSQLExtension.scala b/...bi-extension-spark-3-3/src/main/scala/org/apache/kyuubi/sql/KyuubiSparkSQLExtension.scala
@@ -40,7 +40,7 @@ class KyuubiSparkSQLExtension extends (SparkSessionExtensions => Unit) {
     extensions.injectOptimizerRule(ForcedMaxOutputRowsRule)
     extensions.injectPlannerStrategy(MaxScanStrategy)
 
-    extensions.injectQueryStagePrepRule(FinalStageResourceManager)
+    extensions.injectQueryStagePrepRule(FinalStageResourceManager(_))
     extensions.injectQueryStagePrepRule(InjectCustomResourceProfile)
   }
 }
diff --git a/...i-extension-spark-3-3/src/main/scala/org/apache/spark/sql/FinalStageResourceManager.scala b/...i-extension-spark-3-3/src/main/scala/org/apache/spark/sql/FinalStageResourceManager.scala
@@ -22,6 +22,7 @@ import scala.collection.mutable
 import scala.collection.mutable.ArrayBuffer
 
 import org.apache.spark.{ExecutorAllocationClient, MapOutputTrackerMaster, SparkContext, SparkEnv}
+import org.apache.spark.internal.Logging
 import org.apache.spark.resource.ResourceProfile
 import org.apache.spark.scheduler.cluster.CoarseGrainedSchedulerBackend
 import org.apache.spark.sql.catalyst.rules.Rule
@@ -217,7 +218,7 @@ case class FinalStageResourceManager(session: SparkSession)
       countFailures = false,
       force = false)
 
-    getAdjustedTargetExecutors(sc, executorAllocationClient)
+    FinalStageResourceManager.getAdjustedTargetExecutors(sc)
       .filter(_ < targetExecutors).foreach { adjustedExecutors =>
         val delta = targetExecutors - adjustedExecutors
         logInfo(s"Target executors after kill ($adjustedExecutors) is lower than required " +
@@ -226,10 +227,16 @@ case class FinalStageResourceManager(session: SparkSession)
       }
   }
 
-  private def getAdjustedTargetExecutors(
-      sc: SparkContext,
-      executorAllocationClient: ExecutorAllocationClient): Option[Int] = {
-    executorAllocationClient match {
+  @transient private val queryStageOptimizerRules: Seq[Rule[SparkPlan]] = Seq(
+    OptimizeSkewInRebalancePartitions,
+    CoalesceShufflePartitions(session),
+    OptimizeShuffleWithLocalRead)
+}
+
+object FinalStageResourceManager extends Logging {
+
+  private[sql] def getAdjustedTargetExecutors(sc: SparkContext): Option[Int] = {
+    sc.schedulerBackend match {
       case schedulerBackend: CoarseGrainedSchedulerBackend =>
         try {
           val field = classOf[CoarseGrainedSchedulerBackend]
@@ -249,11 +256,6 @@ case class FinalStageResourceManager(session: SparkSession)
       case _ => None
     }
   }
-
-  @transient private val queryStageOptimizerRules: Seq[Rule[SparkPlan]] = Seq(
-    OptimizeSkewInRebalancePartitions,
-    CoalesceShufflePartitions(session),
-    OptimizeShuffleWithLocalRead)
 }
 
 trait FinalRebalanceStageHelper extends AdaptiveSparkPlanHelper {

diff --git a/...ension-spark-3-3/src/test/scala/org/apache/spark/sql/FinalStageResourceManagerSuite.scala b/...ension-spark-3-3/src/test/scala/org/apache/spark/sql/FinalStageResourceManagerSuite.scala
@@ -55,6 +55,7 @@ class FinalStageResourceManagerSuite extends KyuubiSparkSQLExtensionTest {
           sql(
             "CREATE TABLE final_stage AS SELECT id, count(*) as num FROM (SELECT 0 id) GROUP BY id")
         }
+        assert(FinalStageResourceManager.getAdjustedTargetExecutors(spark.sparkContext).get == 1)
       }
     }
   }

diff --git a/...bi-extension-spark-3-4/src/main/scala/org/apache/kyuubi/sql/KyuubiSparkSQLExtension.scala b/...bi-extension-spark-3-4/src/main/scala/org/apache/kyuubi/sql/KyuubiSparkSQLExtension.scala
@@ -40,7 +40,7 @@ class KyuubiSparkSQLExtension extends (SparkSessionExtensions => Unit) {
     extensions.injectOptimizerRule(ForcedMaxOutputRowsRule)
     extensions.injectPlannerStrategy(MaxScanStrategy)
 
-    extensions.injectQueryStagePrepRule(FinalStageResourceManager)
+    extensions.injectQueryStagePrepRule(FinalStageResourceManager(_))
     extensions.injectQueryStagePrepRule(InjectCustomResourceProfile)
   }
 }
diff --git a/...i-extension-spark-3-4/src/main/scala/org/apache/spark/sql/FinalStageResourceManager.scala b/...i-extension-spark-3-4/src/main/scala/org/apache/spark/sql/FinalStageResourceManager.scala
@@ -22,6 +22,7 @@ import scala.collection.mutable
 import scala.collection.mutable.ArrayBuffer
 
 import org.apache.spark.{ExecutorAllocationClient, MapOutputTrackerMaster, SparkContext, SparkEnv}
+import org.apache.spark.internal.Logging
 import org.apache.spark.resource.ResourceProfile
 import org.apache.spark.scheduler.cluster.CoarseGrainedSchedulerBackend
 import org.apache.spark.sql.catalyst.rules.Rule
@@ -220,7 +221,7 @@ case class FinalStageResourceManager(session: SparkSession)
       countFailures = false,
       force = false)
 
-    getAdjustedTargetExecutors(sc, executorAllocationClient)
+    FinalStageResourceManager.getAdjustedTargetExecutors(sc)
       .filter(_ < targetExecutors).foreach { adjustedExecutors =>
         val delta = targetExecutors - adjustedExecutors
         logInfo(s"Target executors after kill ($adjustedExecutors) is lower than required " +
@@ -229,10 +230,16 @@ case class FinalStageResourceManager(session: SparkSession)
       }
   }
 
-  private def getAdjustedTargetExecutors(
-      sc: SparkContext,
-      executorAllocationClient: ExecutorAllocationClient): Option[Int] = {
-    executorAllocationClient match {
+  @transient private val queryStageOptimizerRules: Seq[Rule[SparkPlan]] = Seq(
+    OptimizeSkewInRebalancePartitions,
+    CoalesceShufflePartitions(session),
+    OptimizeShuffleWithLocalRead)
+}
+
+object FinalStageResourceManager extends Logging {
+
+  private[sql] def getAdjustedTargetExecutors(sc: SparkContext): Option[Int] = {
+    sc.schedulerBackend match {
       case schedulerBackend: CoarseGrainedSchedulerBackend =>
         try {
           val field = classOf[CoarseGrainedSchedulerBackend]
@@ -252,11 +259,6 @@ case class FinalStageResourceManager(session: SparkSession)
       case _ => None
     }
   }
-
-  @transient private val queryStageOptimizerRules: Seq[Rule[SparkPlan]] = Seq(
-    OptimizeSkewInRebalancePartitions,
-    CoalesceShufflePartitions(session),
-    OptimizeShuffleWithLocalRead)
 }
 
 trait FinalRebalanceStageHelper extends AdaptiveSparkPlanHelper {

diff --git a/...ension-spark-3-4/src/test/scala/org/apache/spark/sql/FinalStageResourceManagerSuite.scala b/...ension-spark-3-4/src/test/scala/org/apache/spark/sql/FinalStageResourceManagerSuite.scala
@@ -55,6 +55,7 @@ class FinalStageResourceManagerSuite extends KyuubiSparkSQLExtensionTest {
           sql(
             "CREATE TABLE final_stage AS SELECT id, count(*) as num FROM (SELECT 0 id) GROUP BY id")
         }
+        assert(FinalStageResourceManager.getAdjustedTargetExecutors(spark.sparkContext).get == 1)
       }
     }
   }
-Original file line number
+Diff line change
@@ Expand Up @@
               sql(
                 "CREATE TABLE final_stage AS SELECT id, count(*) as num FROM (SELECT 0 id) GROUP BY id")
             }
+            assert(FinalStageResourceManager.getAdjustedTargetExecutors(spark.sparkContext).get == 1)
           }
         }
       }
@@ Expand Down @@