changed type to SQL_PANDAS_UDF

apache · BryanCutler · Jul 14, 2017 · Jul 14, 2017 · Jul 14, 2017 · Aug 4, 2017
commit 4a2fec2aca1998ad04862eeac60d54b088b99de5
diff --git a/core/src/main/scala/org/apache/spark/api/python/PythonRDD.scala b/core/src/main/scala/org/apache/spark/api/python/PythonRDD.scala
@@ -89,7 +89,7 @@ private[spark] case class ChainedPythonFunctions(funcs: Seq[PythonFunction])
 private[spark] object PythonEvalType {
   val NON_UDF = 0
   val SQL_BATCHED_UDF = 1
-  val SQL_ARROW_UDF = 2
+  val SQL_PANDAS_UDF = 2
 }
 
 private[spark] object PythonRunner {

diff --git a/python/pyspark/serializers.py b/python/pyspark/serializers.py
@@ -84,7 +84,7 @@ class SpecialLengths(object):
 class PythonEvalType(object):
     NON_UDF = 0
     SQL_BATCHED_UDF = 1
-    SQL_ARROW_UDF = 2
+    SQL_PANDAS_UDF = 2
 
 
 class Serializer(object):

diff --git a/python/pyspark/worker.py b/python/pyspark/worker.py
@@ -104,7 +104,7 @@ def read_udfs(pickleSer, infile, eval_type):
 
     func = lambda _, it: map(mapper, it)
 
-    if eval_type == PythonEvalType.SQL_ARROW_UDF:
+    if eval_type == PythonEvalType.SQL_PANDAS_UDF:
         ser = ArrowPandasSerializer()
     else:
         ser = BatchedSerializer(PickleSerializer(), 100)

diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/python/ArrowEvalPythonExec.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/python/ArrowEvalPythonExec.scala
@@ -108,7 +108,7 @@ case class ArrowEvalPythonExec(udfs: Seq[PythonUDF], output: Seq[Attribute], chi
 
       // Output iterator for results from Python.
       val outputIterator = new PythonRunner(
-          pyFuncs, bufferSize, reuseWorker, PythonEvalType.SQL_ARROW_UDF, argOffsets).
+          pyFuncs, bufferSize, reuseWorker, PythonEvalType.SQL_PANDAS_UDF, argOffsets).
         compute(inputIterator, context.partitionId(), context)
 
       val joined = new JoinedRow