chore: update DataFusion dependencies to 53.0.0 by Copilot · Pull Request #1442 · lakehq/sail

Copilot · 2026-02-28T03:12:48Z

🔒 GitHub Advanced Security automatically protects Copilot coding agent pull requests. You can protect all pull requests by enabling Advanced Security for your repositories. Learn more about Advanced Security.

…anges (partial) Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

…SimplifyContext, PartitionedFile, ScalarValue) Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

…physical-plan properties, CoalesceBatches removal Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

github-actions · 2026-02-28T05:54:29Z

Spark 3.5.7 Test Report

Commit Information

Commit	Revision	Branch
After	`09f814b`	`refs/pull/1442/merge`
Before	`1bb4bd6`	`refs/heads/main`

Test Summary

Suite	Commit	Failed	Passed	Skipped	Warnings	Time (s)
`doctest-catalog`	After	12	13		6	4.96
	Before	12	13		6	5.58
`doctest-column`	After		33		2	5.35
	Before		33		2	5.62
`doctest-dataframe`	After	25	80	2	3	7.95
	Before	25	80	2	3	8.10
`doctest-functions`	After	72	330	7	7	14.97
	Before	71	331	7	7	15.19
`test-connect`	After	190	812	169	690	125.65
	Before	190	812	169	691	129.72

Test Details

Error Counts

(+1)      299 Total
          149 Total Unique
-------- ---- ----------------------------------------------------------------------------------------------------------
(+1)       27 DocTestFailure
           17 PySparkAssertionError: [DIFFERENT_PANDAS_DATAFRAME] DataFrames are not almost equal:
           15 AssertionError: AnalysisException not raised
           15 UnsupportedOperationException: lambda function
           10 handle add artifacts
            6 AssertionError: "AttributeError" does not match "
            6 AssertionError: False is not true
            6 UnsupportedOperationException: PlanNode::CacheTable
            6 UnsupportedOperationException: function: window
            4 AssertionError: "TABLE_OR_VIEW_NOT_FOUND" does not match "view not found: v"
            4 AssertionError: Attributes of DataFrame.iloc[:, 7] (column name="8_timestamp_t") are different
            4 PySparkNotImplementedError: [NOT_IMPLEMENTED] rdd() is not implemented.
            4 UnsupportedOperationException: function: input_file_name
            4 UnsupportedOperationException: unknown aggregate function: hll_sketch_agg
            3 AnalysisException: No files found in the specified paths: file:///home/runner/work/sail/sail/.venvs/test-spark.spark-3.5.7/lib/python3.11/site-packages/pyspark/python/test_support/sql/ages_newlines.cs...
            3 AssertionError: Attributes of DataFrame.iloc[:, 0] (column name="time") are different
            3 UnsupportedOperationException: handle analyze input files
            3 ValueError: Converting to Python dictionary is not supported when duplicate field names are present
            2 AnalysisException: Could not find config namespace "spark"
            2 AnalysisException: Failed to coerce arguments to satisfy a call to 'approx_percentile_cont' function: coercion from Float64, List(Float64), Int32 to the signature OneOf([Exact([Int8, Float64]), Exact(...
            2 AnalysisException: No table format found for: orc
            2 AnalysisException: not supported: function exists
            2 AnalysisException: not supported: list functions
            2 AnalysisException: two values expected: [Column(Column { relation: None, name: "#2" }), Column(Column { relation: None, name: "#3" }), Literal(Utf8("/"), None)]
            2 AssertionError
            2 AssertionError: "Exception thrown when converting pandas.Series" does not match "
            2 AssertionError: "\[UDTF_EXEC_ERROR\] User defined table function encountered an error in the 'eval' method: error" does not match " Exception: error
            2 AssertionError: "\[UDTF_EXEC_ERROR\] User defined table function encountered an error in the 'terminate' method: terminate error" does not match " ValueError: terminate error
            2 AssertionError: 0 not greater than or equal to 1
            2 AssertionError: AnalysisException not raised by <lambda>
            2 AssertionError: Lists differ: [Row([22 chars](key=1, value='1'), Row(key=10, value='10'), R[2402 chars]99')] != [Row([22 chars](key=0, value='0'), Row(key=1, value='1'), Row[4882 chars]99')]
            2 IllegalArgumentException: expected value at line 1 column 1
            2 IllegalArgumentException: invalid argument: found FUNCTION at 7:15 expected 'DATABASE', 'SCHEMA', 'OR', 'TEMP', 'TEMPORARY', 'EXTERNAL', 'TABLE', 'GLOBAL', or 'VIEW'
            2 PythonException: 
            2 UnsupportedOperationException: Aggregate can not be used as a sliding accumulator because `retract_batch` is not implemented: avg@dpwaizb7u45fv8mrw1upwqebz(#9) PARTITION BY [#8] ORDER BY [#9 ASC NULLS...
            2 UnsupportedOperationException: approx quantile
            2 UnsupportedOperationException: collect metrics
            2 UnsupportedOperationException: freq items
            2 UnsupportedOperationException: function: from_json
            2 UnsupportedOperationException: function: schema_of_csv
            2 UnsupportedOperationException: handle analyze is local
            2 UnsupportedOperationException: handle analyze same semantics
            2 UnsupportedOperationException: pivot
            2 UnsupportedOperationException: user defined data type should only exist in a field
            2 UnsupportedOperationException: with watermark
            2 handle artifact statuses
            1 AnalysisException: Cannot cast string 'abc' to value of Float64 type
            1 AnalysisException: Cannot cast value 'abc' to value of Boolean type
            1 AnalysisException: Error parsing timestamp from '2023-01-01' using format '%d-%m-%Y': input contains invalid characters
            1 AnalysisException: Failed to parse placeholder id: cannot parse integer from empty string
            1 AnalysisException: No files found in the specified paths: file:///home/runner/work/sail/sail/.venvs/test-spark.spark-3.5.7/lib/python3.11/site-packages/pyspark/sql/functions.py
(+1)        1 AnalysisException: No files found in the specified paths: file:///tmp/tmpls5d3tl8/
(+1)        1 AnalysisException: No files found in the specified paths: file:///tmp/tmpobjvkkoe/
(+1)        1 AnalysisException: No files found in the specified paths: file:///tmp/tmpp0lfedu3/text-0.text, file:///tmp/tmpp0lfedu3/text-1.text, file:///tmp/tmpp0lfedu3/text-2.text
(+1)        1 AnalysisException: UNION queries have different number of columns: left has 3 columns whereas right has 2 columns
            1 AnalysisException: table already exists: tbl1
            1 AnalysisException: temporary view not found: tab2
            1 AssertionError: "2000000" does not match "raise_error expects a single UTF-8 string argument"
            1 AssertionError: "Column names of the returned pandas.DataFrame do not match specified schema. Missing: id. Unexpected: iid. PySparkRuntimeError: [RESULT_COLUMNS_MISMATCH_FOR_PANDAS_UDF] Column names o...
            1 AssertionError: "Column names of the returned pandas.DataFrame do not match specified schema. Missing: mean. Unexpected: median, std. PySparkRuntimeError: [RESULT_COLUMNS_MISMATCH_FOR_PANDAS_UDF] Colu...
(+1)        1 AssertionError: "Database 'memory:8737fa46-18ae-41cc-80e3-1c9c12a6b8ce' dropped." does not match "No table format found for: jdbc"
(+1)        1 AssertionError: "Database 'memory:d3705440-5477-4481-9016-0da254a8194b' dropped." does not match "No table format found for: jdbc"
            1 AssertionError: "My error" does not match "
            1 AssertionError: "Number of columns of the returned pandas.DataFrame doesn't match specified schema. Expected: 2 Actual: 3 PySparkRuntimeError: [RESULT_LENGTH_MISMATCH_FOR_PANDAS_UDF] Number of columns...
            1 AssertionError: "Result vector from pandas_udf was not the required length" does not match "
            1 AssertionError: "Return type of the user-defined function should be pandas.DataFrame, but is int" does not match " PySparkTypeError: [UDF_RETURN_TYPE] R (truncated)"
            1 AssertionError: "Return.*type.*Series" does not match "
            1 AssertionError: "attribute.*missing" does not match "cannot resolve attribute: ObjectName([Identifier("b")])"
            1 AssertionError: "division( or modulo)? by zero" does not match "
            1 AssertionError: "foobar" does not match "raise_error expects a single UTF-8 string argument"
            1 AssertionError: '+--------------------------------+-------------------[411 chars]-+\n' != '+-----------+-----------+\n|from_csv(a)|from_csv(b)|\[105 chars]-+\n'
            1 AssertionError: '+---[17 chars]-----+\n|                        x|\n+--------[132 chars]-+\n' != '+---[17 chars]----------+\n|update_fields(x, WithField(e))|\[167 chars]-+\n'
            1 AssertionError: '4.1.1' != '3.5.7'
            1 AssertionError: 1 != 0
            1 AssertionError: 2 != 6
            1 AssertionError: ArrayIndexOutOfBoundsException not raised
            1 AssertionError: Attributes of DataFrame.iloc[:, 0] (column name="a") are different
            1 AssertionError: Attributes of DataFrame.iloc[:, 0] (column name="ts") are different
            1 AssertionError: Exception not raised by <lambda>
            1 AssertionError: Lists differ: [(1, 2), (3, 4), (None, 5), (0, 0)] != [(1, 2), (3, 4), (None, 5), (None, None)]
            1 AssertionError: Lists differ: [Row([14 chars] _c1=25, _c2='I am Hyukjin\n\nI love Spark!'),[86 chars]om')] != [Row([14 chars] _c1='25', _c2='I am Hyukjin\n\nI love Spark!'[92 chars]om')]
            1 AssertionError: Lists differ: [Row(id=90, name='90'), Row(id=91, name='91'), Ro[176 chars]99')] != [Row(id=15, name='15'), Row(id=16, name='16'), Ro[176 chars]24')]
            1 AssertionError: Lists differ: [Row(key='0'), Row(key='1'), Row(key='10'), Row(ke[1435 chars]99')] != [Row(key=0), Row(key=1), Row(key=10), Row(key=11),[1235 chars]=99)]
            1 AssertionError: Lists differ: [Row(ln(id)=0.0, ln(id)=0.0, struct(id, name)=Row(id=[1232 chars]0'))] != [Row(ln(id)=4.31748811353631, ln(id)=4.31748811353631[1312 chars]4'))]
            1 AssertionError: Lists differ: [Row(name='Andy', age=30), Row(name='Justin', [34 chars]one)] != [Row(_corrupt_record=' "age":19}\n', name=None[104 chars]el')]
            1 AssertionError: Row(point='[1.0, 2.0]', pypoint='[3.0, 4.0]') != Row(point='(1.0, 2.0)', pypoint='[3.0, 4.0]')
            1 AssertionError: StorageLevel(False, True, True, False, 1) != StorageLevel(False, False, False, False, 1)
            1 AssertionError: Struc[30 chars]estampType(), True), StructField('val', IntegerType(), True)]) != Struc[30 chars]estampType(), True), StructField('val', IntegerType(), False)])
            1 AssertionError: Struc[32 chars]e(), False), StructField('b', DoubleType(), Fa[158 chars]ue)]) != Struc[32 chars]e(), True), StructField('b', DoubleType(), Tru[154 chars]ue)])
            1 AssertionError: Struc[40 chars]ue), StructField('val', ArrayType(DoubleType(), False), True)]) != Struc[40 chars]ue), StructField('val', PythonOnlyUDT(), True)])
            1 AssertionError: Struc[64 chars]Type(), True), StructField('i', StringType(), True)]), False)]) != Struc[64 chars]Type(), True), StructField('i', StringType(), True)]), True)])
            1 AssertionError: Struc[69 chars]e(), True), StructField('name', StringType(), True)]), True)]) != Struc[69 chars]e(), True), StructField('name', StringType(), True)]), False)])
            1 AssertionError: YearMonthIntervalType(0, 1) != YearMonthIntervalType(0, 0)
            1 AssertionError: [1.0, 2.0] != ExamplePoint(1.0,2.0)
            1 AssertionError: dtype('<M8[us]') != 'datetime64[ns]'
            1 AttributeError: 'DataFrame' object has no attribute '_ipython_key_completions_'
            1 AttributeError: 'DataFrame' object has no attribute '_joinAsOf'
            1 PySparkNotImplementedError: [NOT_IMPLEMENTED] foreach() is not implemented.
            1 PySparkNotImplementedError: [NOT_IMPLEMENTED] foreachPartition() is not implemented.
            1 PySparkNotImplementedError: [NOT_IMPLEMENTED] localCheckpoint() is not implemented.
            1 PySparkNotImplementedError: [NOT_IMPLEMENTED] sparkContext() is not implemented.
            1 PySparkNotImplementedError: [NOT_IMPLEMENTED] toJSON() is not implemented.
            1 PythonException:  AttributeError: 'NoneType' object has no attribute 'partitionId'
            1 SparkRuntimeException: Invalid argument error: 83.140 is too large to store in a Decimal128 of precision 4. Max is 9.999
            1 SparkRuntimeException: Invalid argument error: column types must match schema types, expected Int64 but found List(Int64) at column index 1
            1 SparkRuntimeException: Invalid argument error: column types must match schema types, expected LargeUtf8 but found Utf8 at column index 0
            1 SparkRuntimeException: Json error: Not valid JSON: EOF while parsing a list at line 1 column 1
            1 SparkRuntimeException: Json error: Not valid JSON: expected value at line 1 column 2
            1 SparkRuntimeException: Parser error: Error parsing timestamp from '1997/02/28 10:30:00': error parsing date
            1 SparkRuntimeException: Parser error: Error while parsing value '0
            1 UnsupportedOperationException: Aggregate can not be used as a sliding accumulator because `retract_batch` is not implemented: avg@dpwaizb7u45fv8mrw1upwqebz(#9) PARTITION BY [#8] ORDER BY [#9 ASC NULLS...
            1 UnsupportedOperationException: Aggregate can not be used as a sliding accumulator because `retract_batch` is not implemented: avg@dpwaizb7u45fv8mrw1upwqebz(plus_one@5u7wzy1x1zf4loxm9n1r277lw(#9)) PART...
            1 UnsupportedOperationException: Physical plan does not support logical expression AggregateFunction(AggregateFunction { func: AggregateUDF { inner: PySparkGroupAggregateUDF { signature: Signature { typ...
            1 UnsupportedOperationException: PlanNode::ClearCache
            1 UnsupportedOperationException: PlanNode::IsCached
            1 UnsupportedOperationException: PlanNode::RecoverPartitions
            1 UnsupportedOperationException: SHOW FUNCTIONS
            1 UnsupportedOperationException: Support for 'approx_distinct' for data type Float64 is not implemented
            1 UnsupportedOperationException: bucketing for writing listing table format
            1 UnsupportedOperationException: deduplicate within watermark
            1 UnsupportedOperationException: function: java_method
            1 UnsupportedOperationException: function: json_tuple
            1 UnsupportedOperationException: function: reflect
            1 UnsupportedOperationException: function: regexp_extract_all
            1 UnsupportedOperationException: function: schema_of_json
            1 UnsupportedOperationException: function: sentences
            1 UnsupportedOperationException: function: session_window
            1 UnsupportedOperationException: function: spark_partition_id
            1 UnsupportedOperationException: function: to_char
            1 UnsupportedOperationException: function: to_csv
            1 UnsupportedOperationException: function: to_varchar
            1 UnsupportedOperationException: function: xpath
            1 UnsupportedOperationException: function: xpath_boolean
            1 UnsupportedOperationException: function: xpath_double
            1 UnsupportedOperationException: function: xpath_float
            1 UnsupportedOperationException: function: xpath_int
            1 UnsupportedOperationException: function: xpath_long
            1 UnsupportedOperationException: function: xpath_number
            1 UnsupportedOperationException: function: xpath_short
            1 UnsupportedOperationException: function: xpath_string
            1 UnsupportedOperationException: handle analyze semantic hash
            1 UnsupportedOperationException: unknown aggregate function: bitmap_construct_agg
            1 UnsupportedOperationException: unknown aggregate function: bitmap_or_agg
            1 UnsupportedOperationException: unknown aggregate function: count_min_sketch
            1 UnsupportedOperationException: unknown aggregate function: grouping_id
            1 UnsupportedOperationException: unknown function: distributed_sequence_id
            1 UnsupportedOperationException: unknown function: product
            1 ValueError: The column label 'id' is not unique.
            1 ValueError: The column label 'struct' is not unique.
(-1)        0 AnalysisException: No files found in the specified paths: file:///tmp/tmpgvup_mu7/
(-1)        0 AnalysisException: No files found in the specified paths: file:///tmp/tmpl3_4hz3r/
(-1)        0 AnalysisException: No files found in the specified paths: file:///tmp/tmpnjnaeblg/text-0.text, file:///tmp/tmpnjnaeblg/text-1.text, file:///tmp/tmpnjnaeblg/text-2.text
(-1)        0 AnalysisException: UNION queries have different number of columns: left has 2 columns whereas right has 3 columns
(-1)        0 AssertionError: "Database 'memory:f5c8b558-e45e-4509-a25b-c6bce933c846' dropped." does not match "No table format found for: jdbc"
(-1)        0 AssertionError: "Database 'memory:f6330ff9-be61-406a-8706-5b2b9bff1636' dropped." does not match "No table format found for: jdbc"

Passed Tests Diff

--- before.txt	2026-03-25 11:25:06.692763681 +0000
+++ after.txt	2026-03-25 11:25:06.821763680 +0000
@@ -138 +137,0 @@
-pyspark/sql/functions.py::pyspark.sql.functions.array_compact
@@ -143 +141,0 @@
-pyspark/sql/functions.py::pyspark.sql.functions.array_intersect
@@ -150,0 +149 @@
+pyspark/sql/functions.py::pyspark.sql.functions.array_union

Failed Tests

pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.cacheTable
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.clearCache
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.createTable
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.functionExists
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.getFunction
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.isCached
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.listCatalogs
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.listFunctions
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.recoverPartitions
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.refreshByPath
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.refreshTable
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.uncacheTable
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame._ipython_key_completions_
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame._joinAsOf
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.checkpoint
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.coalesce
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.colRegex
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.dropDuplicatesWithinWatermark
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.explain
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.foreach
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.foreachPartition
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.hint
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.inputFiles
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.isLocal
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.isStreaming
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.localCheckpoint
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.observe
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.randomSplit
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.rdd
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.repartition
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.repartitionByRange
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.sameSemantics
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.sampleBy
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.storageLevel
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.toJSON
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.withWatermark
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrameStatFunctions.sampleBy
pyspark/sql/functions.py::pyspark.sql.functions.aggregate
pyspark/sql/functions.py::pyspark.sql.functions.approx_percentile
pyspark/sql/functions.py::pyspark.sql.functions.array_compact
pyspark/sql/functions.py::pyspark.sql.functions.array_intersect
pyspark/sql/functions.py::pyspark.sql.functions.array_position
pyspark/sql/functions.py::pyspark.sql.functions.array_sort
pyspark/sql/functions.py::pyspark.sql.functions.arrays_zip
pyspark/sql/functions.py::pyspark.sql.functions.bitmap_construct_agg
pyspark/sql/functions.py::pyspark.sql.functions.bitmap_or_agg
pyspark/sql/functions.py::pyspark.sql.functions.count_min_sketch
pyspark/sql/functions.py::pyspark.sql.functions.exists
pyspark/sql/functions.py::pyspark.sql.functions.filter
pyspark/sql/functions.py::pyspark.sql.functions.first
pyspark/sql/functions.py::pyspark.sql.functions.forall
pyspark/sql/functions.py::pyspark.sql.functions.from_csv
pyspark/sql/functions.py::pyspark.sql.functions.from_json
pyspark/sql/functions.py::pyspark.sql.functions.grouping_id
pyspark/sql/functions.py::pyspark.sql.functions.hll_sketch_agg
pyspark/sql/functions.py::pyspark.sql.functions.hll_sketch_estimate
pyspark/sql/functions.py::pyspark.sql.functions.hll_union
pyspark/sql/functions.py::pyspark.sql.functions.hll_union_agg
pyspark/sql/functions.py::pyspark.sql.functions.ilike
pyspark/sql/functions.py::pyspark.sql.functions.input_file_block_length
pyspark/sql/functions.py::pyspark.sql.functions.input_file_block_start
pyspark/sql/functions.py::pyspark.sql.functions.input_file_name
pyspark/sql/functions.py::pyspark.sql.functions.java_method
pyspark/sql/functions.py::pyspark.sql.functions.json_tuple
pyspark/sql/functions.py::pyspark.sql.functions.kurtosis
pyspark/sql/functions.py::pyspark.sql.functions.like
pyspark/sql/functions.py::pyspark.sql.functions.map_entries
pyspark/sql/functions.py::pyspark.sql.functions.map_filter
pyspark/sql/functions.py::pyspark.sql.functions.map_zip_with
pyspark/sql/functions.py::pyspark.sql.functions.mode
pyspark/sql/functions.py::pyspark.sql.functions.monotonically_increasing_id
pyspark/sql/functions.py::pyspark.sql.functions.percentile
pyspark/sql/functions.py::pyspark.sql.functions.percentile_approx
pyspark/sql/functions.py::pyspark.sql.functions.product
pyspark/sql/functions.py::pyspark.sql.functions.randn
pyspark/sql/functions.py::pyspark.sql.functions.reduce
pyspark/sql/functions.py::pyspark.sql.functions.reflect
pyspark/sql/functions.py::pyspark.sql.functions.regexp_extract
pyspark/sql/functions.py::pyspark.sql.functions.regexp_extract_all
pyspark/sql/functions.py::pyspark.sql.functions.regexp_instr
pyspark/sql/functions.py::pyspark.sql.functions.regr_avgy
pyspark/sql/functions.py::pyspark.sql.functions.regr_intercept
pyspark/sql/functions.py::pyspark.sql.functions.regr_r2
pyspark/sql/functions.py::pyspark.sql.functions.regr_slope
pyspark/sql/functions.py::pyspark.sql.functions.regr_sxy
pyspark/sql/functions.py::pyspark.sql.functions.regr_syy
pyspark/sql/functions.py::pyspark.sql.functions.schema_of_csv
pyspark/sql/functions.py::pyspark.sql.functions.schema_of_json
pyspark/sql/functions.py::pyspark.sql.functions.sentences
pyspark/sql/functions.py::pyspark.sql.functions.session_window
pyspark/sql/functions.py::pyspark.sql.functions.spark_partition_id
pyspark/sql/functions.py::pyspark.sql.functions.to_char
pyspark/sql/functions.py::pyspark.sql.functions.to_csv
pyspark/sql/functions.py::pyspark.sql.functions.to_varchar
pyspark/sql/functions.py::pyspark.sql.functions.transform
pyspark/sql/functions.py::pyspark.sql.functions.transform_keys
pyspark/sql/functions.py::pyspark.sql.functions.transform_values
pyspark/sql/functions.py::pyspark.sql.functions.window
pyspark/sql/functions.py::pyspark.sql.functions.window_time
pyspark/sql/functions.py::pyspark.sql.functions.xpath
pyspark/sql/functions.py::pyspark.sql.functions.xpath_boolean
pyspark/sql/functions.py::pyspark.sql.functions.xpath_double
pyspark/sql/functions.py::pyspark.sql.functions.xpath_float
pyspark/sql/functions.py::pyspark.sql.functions.xpath_int
pyspark/sql/functions.py::pyspark.sql.functions.xpath_long
pyspark/sql/functions.py::pyspark.sql.functions.xpath_number
pyspark/sql/functions.py::pyspark.sql.functions.xpath_short
pyspark/sql/functions.py::pyspark.sql.functions.xpath_string
pyspark/sql/functions.py::pyspark.sql.functions.zip_with
pyspark/sql/tests/connect/client/test_artifact.py::ArtifactTests::test_add_archive
pyspark/sql/tests/connect/client/test_artifact.py::ArtifactTests::test_add_file
pyspark/sql/tests/connect/client/test_artifact.py::ArtifactTests::test_add_pyfile
pyspark/sql/tests/connect/client/test_artifact.py::ArtifactTests::test_add_zipped_package
pyspark/sql/tests/connect/client/test_artifact.py::ArtifactTests::test_basic_requests
pyspark/sql/tests/connect/client/test_artifact.py::ArtifactTests::test_cache_artifact
pyspark/sql/tests/connect/client/test_artifact.py::ArtifactTests::test_copy_from_local_to_fs
pyspark/sql/tests/connect/client/test_artifact.py::LocalClusterArtifactTests::test_add_archive
pyspark/sql/tests/connect/client/test_artifact.py::LocalClusterArtifactTests::test_add_file
pyspark/sql/tests/connect/client/test_artifact.py::LocalClusterArtifactTests::test_add_pyfile
pyspark/sql/tests/connect/client/test_artifact.py::LocalClusterArtifactTests::test_add_zipped_package
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_collect
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_collect_timestamp
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_column_regexp
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_create_global_temp_view
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_deduplicate_within_watermark_in_batch
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_describe
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_explain_string
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_grouped_data
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_hint
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_input_files
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_invalid_column
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_is_local
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_join_hint
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_json
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_multi_paths
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_namedargs_with_global_limit
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_numeric_aggregation
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_observe
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_orc
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_random_split
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_same_semantics
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_schema
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_semantic_hash
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_simple_read_without_schema
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_simple_udt_from_read
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_sql_with_command
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_sql_with_pos_args
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_stat_approx_quantile
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_stat_freq_items
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_stat_sample_by
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_streaming_local_relation
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_tail
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_to
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_version
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_with_local_list
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_with_local_ndarray
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectBasicTests::test_write_operations
pyspark/sql/tests/connect/test_connect_basic.py::SparkConnectSessionTests::test_error_stack_trace
pyspark/sql/tests/connect/test_connect_column.py::SparkConnectColumnTests::test_column_accessor
pyspark/sql/tests/connect/test_connect_column.py::SparkConnectColumnTests::test_column_arithmetic_ops
pyspark/sql/tests/connect/test_connect_column.py::SparkConnectColumnTests::test_column_field_ops
pyspark/sql/tests/connect/test_connect_column.py::SparkConnectColumnTests::test_columns
pyspark/sql/tests/connect/test_connect_column.py::SparkConnectColumnTests::test_decimal
pyspark/sql/tests/connect/test_connect_column.py::SparkConnectColumnTests::test_distributed_sequence_id
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_aggregation_functions
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_collection_functions
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_csv_functions
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_date_ts_functions
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_generator_functions
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_json_functions
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_lambda_functions
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_map_collection_functions
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_math_functions
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_nested_lambda_function
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_normal_functions
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_string_functions_multi_args
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_string_functions_one_arg
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_time_window_functions
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_udf
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_udtf
pyspark/sql/tests/connect/test_connect_function.py::SparkConnectFunctionTests::test_window_functions
pyspark/sql/tests/connect/test_parity_arrow.py::ArrowParityTests::test_createDataFrame_duplicate_field_names
pyspark/sql/tests/connect/test_parity_arrow.py::ArrowParityTests::test_createDataFrame_with_schema
pyspark/sql/tests/connect/test_parity_arrow.py::ArrowParityTests::test_pandas_round_trip
pyspark/sql/tests/connect/test_parity_arrow.py::ArrowParityTests::test_pandas_self_destruct
pyspark/sql/tests/connect/test_parity_arrow.py::ArrowParityTests::test_propagates_spark_exception
pyspark/sql/tests/connect/test_parity_arrow.py::ArrowParityTests::test_timestamp_dst
pyspark/sql/tests/connect/test_parity_arrow.py::ArrowParityTests::test_timestamp_nat
pyspark/sql/tests/connect/test_parity_arrow.py::ArrowParityTests::test_toPandas_arrow_toggle
pyspark/sql/tests/connect/test_parity_arrow.py::ArrowParityTests::test_toPandas_duplicate_field_names
pyspark/sql/tests/connect/test_parity_arrow.py::ArrowParityTests::test_toPandas_nested_timestamp
pyspark/sql/tests/connect/test_parity_arrow.py::ArrowParityTests::test_toPandas_respect_session_timezone
pyspark/sql/tests/connect/test_parity_arrow.py::ArrowParityTests::test_toPandas_timestmap_tzinfo
pyspark/sql/tests/connect/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_nondeterministic_udf_in_aggregate
pyspark/sql/tests/connect/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_in_join_condition
pyspark/sql/tests/connect/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_not_supported_in_join_condition
pyspark/sql/tests/connect/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_with_input_file_name
pyspark/sql/tests/connect/test_parity_arrow_python_udf.py::UDFParityTests::test_nondeterministic_udf_in_aggregate
pyspark/sql/tests/connect/test_parity_arrow_python_udf.py::UDFParityTests::test_udf_in_join_condition
pyspark/sql/tests/connect/test_parity_arrow_python_udf.py::UDFParityTests::test_udf_not_supported_in_join_condition
pyspark/sql/tests/connect/test_parity_arrow_python_udf.py::UDFParityTests::test_udf_with_input_file_name
pyspark/sql/tests/connect/test_parity_catalog.py::CatalogParityTests::test_function_exists
pyspark/sql/tests/connect/test_parity_catalog.py::CatalogParityTests::test_get_function
pyspark/sql/tests/connect/test_parity_catalog.py::CatalogParityTests::test_list_functions
pyspark/sql/tests/connect/test_parity_catalog.py::CatalogParityTests::test_refresh_table
pyspark/sql/tests/connect/test_parity_catalog.py::CatalogParityTests::test_table_cache
pyspark/sql/tests/connect/test_parity_dataframe.py::DataFrameParityTests::test_cache_dataframe
pyspark/sql/tests/connect/test_parity_dataframe.py::DataFrameParityTests::test_cache_table
pyspark/sql/tests/connect/test_parity_dataframe.py::DataFrameParityTests::test_create_dataframe_from_pandas_with_dst
pyspark/sql/tests/connect/test_parity_dataframe.py::DataFrameParityTests::test_duplicate_field_names
pyspark/sql/tests/connect/test_parity_dataframe.py::DataFrameParityTests::test_extended_hint_types
pyspark/sql/tests/connect/test_parity_dataframe.py::DataFrameParityTests::test_freqItems
pyspark/sql/tests/connect/test_parity_dataframe.py::DataFrameParityTests::test_generic_hints
pyspark/sql/tests/connect/test_parity_dataframe.py::DataFrameParityTests::test_input_files
pyspark/sql/tests/connect/test_parity_dataframe.py::DataFrameParityTests::test_join_without_on
pyspark/sql/tests/connect/test_parity_dataframe.py::DataFrameParityTests::test_require_cross
pyspark/sql/tests/connect/test_parity_dataframe.py::DataFrameParityTests::test_to
pyspark/sql/tests/connect/test_parity_dataframe.py::DataFrameParityTests::test_to_pandas
pyspark/sql/tests/connect/test_parity_datasources.py::DataSourcesParityTests::test_checking_csv_header
pyspark/sql/tests/connect/test_parity_datasources.py::DataSourcesParityTests::test_encoding_json
pyspark/sql/tests/connect/test_parity_datasources.py::DataSourcesParityTests::test_ignore_column_of_all_nulls
pyspark/sql/tests/connect/test_parity_datasources.py::DataSourcesParityTests::test_ignorewhitespace_csv
pyspark/sql/tests/connect/test_parity_datasources.py::DataSourcesParityTests::test_jdbc
pyspark/sql/tests/connect/test_parity_datasources.py::DataSourcesParityTests::test_jdbc_format
pyspark/sql/tests/connect/test_parity_datasources.py::DataSourcesParityTests::test_linesep_json
pyspark/sql/tests/connect/test_parity_datasources.py::DataSourcesParityTests::test_linesep_text
pyspark/sql/tests/connect/test_parity_datasources.py::DataSourcesParityTests::test_multiline_csv
pyspark/sql/tests/connect/test_parity_datasources.py::DataSourcesParityTests::test_multiline_json
pyspark/sql/tests/connect/test_parity_datasources.py::DataSourcesParityTests::test_read_multiple_orc_file
pyspark/sql/tests/connect/test_parity_errors.py::ErrorsParityTests::test_array_index_out_of_bounds_exception
pyspark/sql/tests/connect/test_parity_errors.py::ErrorsParityTests::test_date_time_exception
pyspark/sql/tests/connect/test_parity_errors.py::ErrorsParityTests::test_number_format_exception
pyspark/sql/tests/connect/test_parity_errors.py::ErrorsParityTests::test_spark_runtime_exception
pyspark/sql/tests/connect/test_parity_functions.py::FunctionsParityTests::test_approxQuantile
pyspark/sql/tests/connect/test_parity_functions.py::FunctionsParityTests::test_assert_true
pyspark/sql/tests/connect/test_parity_functions.py::FunctionsParityTests::test_functions_broadcast
pyspark/sql/tests/connect/test_parity_functions.py::FunctionsParityTests::test_inline
pyspark/sql/tests/connect/test_parity_functions.py::FunctionsParityTests::test_input_file_name_udf
pyspark/sql/tests/connect/test_parity_functions.py::FunctionsParityTests::test_nested_higher_order_function
pyspark/sql/tests/connect/test_parity_functions.py::FunctionsParityTests::test_raise_error
pyspark/sql/tests/connect/test_parity_functions.py::FunctionsParityTests::test_window_time
pyspark/sql/tests/connect/test_parity_pandas_cogrouped_map.py::CogroupedApplyInPandasTests::test_apply_in_pandas_not_returning_pandas_dataframe
pyspark/sql/tests/connect/test_parity_pandas_grouped_map.py::GroupedApplyInPandasTests::test_apply_in_pandas_returning_no_column_names_and_wrong_amount
pyspark/sql/tests/connect/test_parity_pandas_grouped_map.py::GroupedApplyInPandasTests::test_apply_in_pandas_returning_wrong_column_names
pyspark/sql/tests/connect/test_parity_pandas_grouped_map.py::GroupedApplyInPandasTests::test_column_order
pyspark/sql/tests/connect/test_parity_pandas_grouped_map.py::GroupedApplyInPandasTests::test_grouped_over_window
pyspark/sql/tests/connect/test_parity_pandas_grouped_map.py::GroupedApplyInPandasTests::test_grouped_over_window_with_key
pyspark/sql/tests/connect/test_parity_pandas_grouped_map_with_state.py::GroupedApplyInPandasWithStateTests::test_apply_in_pandas_with_state_python_worker_random_failure
pyspark/sql/tests/connect/test_parity_pandas_map.py::MapInPandasParityTests::test_large_variable_types
pyspark/sql/tests/connect/test_parity_pandas_udf.py::PandasUDFParityTests::test_pandas_udf_arrow_overflow
pyspark/sql/tests/connect/test_parity_pandas_udf.py::PandasUDFParityTests::test_pandas_udf_detect_unsafe_type_conversion
pyspark/sql/tests/connect/test_parity_pandas_udf_grouped_agg.py::PandasUDFGroupedAggParityTests::test_invalid_args
pyspark/sql/tests/connect/test_parity_pandas_udf_scalar.py::PandasUDFScalarParityTests::test_nondeterministic_vectorized_udf_in_aggregate
pyspark/sql/tests/connect/test_parity_pandas_udf_scalar.py::PandasUDFScalarParityTests::test_scalar_iter_udf_init
pyspark/sql/tests/connect/test_parity_pandas_udf_scalar.py::PandasUDFScalarParityTests::test_vectorized_udf_check_config
pyspark/sql/tests/connect/test_parity_pandas_udf_scalar.py::PandasUDFScalarParityTests::test_vectorized_udf_exception
pyspark/sql/tests/connect/test_parity_pandas_udf_scalar.py::PandasUDFScalarParityTests::test_vectorized_udf_invalid_length
pyspark/sql/tests/connect/test_parity_pandas_udf_scalar.py::PandasUDFScalarParityTests::test_vectorized_udf_return_scalar
pyspark/sql/tests/connect/test_parity_pandas_udf_window.py::PandasUDFWindowParityTests::test_bounded_mixed
pyspark/sql/tests/connect/test_parity_pandas_udf_window.py::PandasUDFWindowParityTests::test_bounded_simple
pyspark/sql/tests/connect/test_parity_pandas_udf_window.py::PandasUDFWindowParityTests::test_shrinking_window
pyspark/sql/tests/connect/test_parity_pandas_udf_window.py::PandasUDFWindowParityTests::test_sliding_window
pyspark/sql/tests/connect/test_parity_readwriter.py::ReadwriterParityTests::test_bucketed_write
pyspark/sql/tests/connect/test_parity_readwriter.py::ReadwriterParityTests::test_insert_into
pyspark/sql/tests/connect/test_parity_readwriter.py::ReadwriterParityTests::test_save_and_load
pyspark/sql/tests/connect/test_parity_readwriter.py::ReadwriterParityTests::test_save_and_load_builder
pyspark/sql/tests/connect/test_parity_readwriter.py::ReadwriterV2ParityTests::test_create_without_provider
pyspark/sql/tests/connect/test_parity_readwriter.py::ReadwriterV2ParityTests::test_table_overwrite
pyspark/sql/tests/connect/test_parity_types.py::TypesParityTests::test_cast_to_string_with_udt
pyspark/sql/tests/connect/test_parity_types.py::TypesParityTests::test_cast_to_udt_with_udt
pyspark/sql/tests/connect/test_parity_types.py::TypesParityTests::test_complex_nested_udt_in_df
pyspark/sql/tests/connect/test_parity_types.py::TypesParityTests::test_negative_decimal
pyspark/sql/tests/connect/test_parity_types.py::TypesParityTests::test_parquet_with_udt
pyspark/sql/tests/connect/test_parity_types.py::TypesParityTests::test_udf_with_udt
pyspark/sql/tests/connect/test_parity_types.py::TypesParityTests::test_udt_with_none
pyspark/sql/tests/connect/test_parity_types.py::TypesParityTests::test_yearmonth_interval_type
pyspark/sql/tests/connect/test_parity_udf.py::UDFParityTests::test_nondeterministic_udf_in_aggregate
pyspark/sql/tests/connect/test_parity_udf.py::UDFParityTests::test_udf_in_join_condition
pyspark/sql/tests/connect/test_parity_udf.py::UDFParityTests::test_udf_not_supported_in_join_condition
pyspark/sql/tests/connect/test_parity_udf.py::UDFParityTests::test_udf_with_input_file_name
pyspark/sql/tests/connect/test_parity_udtf.py::ArrowUDTFParityTests::test_eval_with_exception
pyspark/sql/tests/connect/test_parity_udtf.py::ArrowUDTFParityTests::test_terminate_with_exceptions
pyspark/sql/tests/connect/test_parity_udtf.py::ArrowUDTFParityTests::test_udtf_arrow_sql_conf
pyspark/sql/tests/connect/test_parity_udtf.py::ArrowUDTFParityTests::test_udtf_with_table_argument_malformed_query
pyspark/sql/tests/connect/test_parity_udtf.py::ArrowUDTFParityTests::test_udtf_with_table_argument_multiple
pyspark/sql/tests/connect/test_parity_udtf.py::ArrowUDTFParityTests::test_udtf_with_table_argument_unknown_identifier
pyspark/sql/tests/connect/test_parity_udtf.py::UDTFParityTests::test_array_output_type_casting
pyspark/sql/tests/connect/test_parity_udtf.py::UDTFParityTests::test_eval_with_exception
pyspark/sql/tests/connect/test_parity_udtf.py::UDTFParityTests::test_map_output_type_casting
pyspark/sql/tests/connect/test_parity_udtf.py::UDTFParityTests::test_numeric_output_type_casting
pyspark/sql/tests/connect/test_parity_udtf.py::UDTFParityTests::test_numeric_string_output_type_casting
pyspark/sql/tests/connect/test_parity_udtf.py::UDTFParityTests::test_string_output_type_casting
pyspark/sql/tests/connect/test_parity_udtf.py::UDTFParityTests::test_struct_output_type_casting_dict
pyspark/sql/tests/connect/test_parity_udtf.py::UDTFParityTests::test_terminate_with_exceptions
pyspark/sql/tests/connect/test_parity_udtf.py::UDTFParityTests::test_udtf_with_table_argument_malformed_query
pyspark/sql/tests/connect/test_parity_udtf.py::UDTFParityTests::test_udtf_with_table_argument_multiple
pyspark/sql/tests/connect/test_parity_udtf.py::UDTFParityTests::test_udtf_with_table_argument_unknown_identifier
pyspark/sql/tests/connect/test_utils.py::ConnectUtilsTests::test_assert_approx_equal_decimaltype_custom_rtol_pass
pyspark/sql/tests/connect/test_utils.py::ConnectUtilsTests::test_assert_equal_nested_struct_str_duplicate

github-actions · 2026-02-28T05:54:31Z

Spark 4.1.1 Test Report

Commit Information

Commit	Revision	Branch
After	`09f814b`	`refs/pull/1442/merge`
Before	`1bb4bd6`	`refs/heads/main`

Test Summary

Suite	Commit	Failed	Passed	Skipped	Warnings	Time (s)
`doctest-catalog`	After	12	13			5.74
	Before	12	13			5.88
`doctest-column`	After		36			6.76
	Before		36			6.79
`doctest-dataframe`	After	34	86	2	3	10.89
	Before	34	86	2	3	10.32
`doctest-functions`	After	143	342	10	5	27.65
	Before	142	343	10	5	25.42
`test-connect`	After	1255	1254	291	481	223.20
	Before	1255	1254	291	482	223.46

Test Details

Error Counts

(+1)     1444 Total
          333 Total Unique
-------- ---- ----------------------------------------------------------------------------------------------------------
          224 PythonException: 
           74 AssertionError: False is not true
           64 IllegalArgumentException: missing argument: Python UDTF return type
           60 IllegalArgumentException: invalid argument: invalid PySpark UDF type: 250
           55 IllegalArgumentException: invalid argument: invalid PySpark UDF type: 252
(+1)       40 DocTestFailure
           36 IllegalArgumentException: invalid argument: invalid PySpark UDF type: 302
           31 UnsupportedOperationException: function: parse_json
           31 UnsupportedOperationException: unresolved table valued function
           27 UnsupportedOperationException: lateral join
           24 UnsupportedOperationException: named argument expression
           23 IllegalArgumentException: expected value at line 1 column 1
           22 UnsupportedOperationException: handle add artifacts
           20 UnsupportedOperationException: variant data type
           15 UnsupportedOperationException: lambda function
           14 AssertionError: 1 != 0 : dict_keys([])
           14 PySparkAssertionError: [DIFFERENT_PANDAS_DATAFRAME] DataFrames are not almost equal:
           14 UnsupportedOperationException: unknown function: kll_sketch_agg_bigint
           13 UnsupportedOperationException: time literal
           12 PythonException:  TypeError: object of type 'generator' has no len()
           11 IllegalArgumentException: invalid argument: expected function for lateral table factor
           11 IllegalArgumentException: invalid argument: invalid PySpark UDF type: 216
           10 AssertionError: AnalysisException not raised
           10 SparkRuntimeException: Python error: [test::partitions] NotImplementedError: 
            9 IllegalArgumentException: invalid argument: invalid PySpark UDF type: 251
            9 UnsupportedOperationException: collect metrics
            9 UnsupportedOperationException: unsupported subquery type
            8 AssertionError
            8 AssertionError: "UDTF_ARROW_TYPE_CONVERSION_ERROR" does not match "
            8 AssertionError: "UDTF_RETURN_SCHEMA_MISMATCH" does not match "
            8 UnsupportedOperationException: unknown function: kll_sketch_agg_double
            8 UnsupportedOperationException: unknown function: kll_sketch_agg_float
            7 AssertionError: 3 != 0 : []
            7 PySparkAssertionError: [DIFFERENT_ROWS] Results do not match: ( 100.00000 % )
            7 UnsupportedOperationException: function: spark_partition_id
            7 UnsupportedOperationException: named function arguments
            7 UnsupportedOperationException: unknown function: theta_sketch_agg
            7 UnsupportedOperationException: user defined data type should only exist in a field
            6 AssertionError: "AttributeError" does not match "
            6 AssertionError: "TABLE_OR_VIEW_NOT_FOUND" does not match "view not found: v"
            6 AssertionError: "UDTF_ARROW_TYPE_CAST_ERROR" does not match "
            6 AssertionError: "UDTF_RETURN_NOT_ITERABLE" does not match "
            6 AssertionError: 1 != 0
            6 AssertionError: Exception not raised
            6 IllegalArgumentException: invalid argument: found range at 40:45 expected '->', '.', '(', '[', '::', 'ESCAPE', 'IS', 'NOT', 'IN', '*', '/', '%', 'DIV', '+', '-', '||', '>>>', '>>', '<<', '&', '^', '|'...
            6 UnsupportedOperationException: PlanNode::CacheTable
            6 UnsupportedOperationException: direct shuffle partition ID expression
            6 UnsupportedOperationException: function: input_file_name
            6 UnsupportedOperationException: function: window
            5 AssertionError: "Python worker process terminated due to idle timeout \(timeout: 1 seconds\)" does not match "
            5 AssertionError: `query_context_type` is required when QueryContext exists. QueryContext: [].
            4 AnalysisException: temporary view not found: t2
            4 AssertionError: AnalysisException not raised by <lambda>
            4 AssertionError: unexpectedly None
            4 UnsupportedOperationException: approx quantile
            4 UnsupportedOperationException: freq items
            4 UnsupportedOperationException: transpose
            4 UnsupportedOperationException: unknown aggregate function: hll_sketch_agg
            4 clone session
            3 AnalysisException: Failed to parse placeholder id: cannot parse integer from empty string
            3 AnalysisException: Invalid Python user-defined table function return type. Expect a struct type, but got Int32.
            3 AnalysisException: No files found in the specified paths: file:///home/runner/work/sail/sail/.venvs/test-spark.spark-4.1.1/lib/python3.11/site-packages/pyspark/python/test_support/sql/ages_newlines.cs...
            3 AssertionError: "(Please use a different output data type for your UDF or DataFrame|Invalid return type with Arrow-optimized Python UDF)" does not match "
            3 AssertionError: 0 not greater than or equal to 1
            3 AssertionError: DayTimeIntervalType(0, 3) != DayTimeIntervalType(1, 3)
            3 AssertionError: Struc[49 chars]valType(0, 3), True), StructField('name', StringType(), True)]) != Struc[49 chars]valType(1, 3), True), StructField('name', StringType(), True)])
            3 IllegalArgumentException: data did not match any variant of untagged enum JsonDataType
            3 IllegalArgumentException: invalid argument: found PARTITION at 281:290 expected '.', '[', '::', 'ESCAPE', 'IS', 'NOT', 'IN', '*', '/', '%', 'DIV', '+', '-', '||', '>>>', '>>', '<<', '&', '^', '|', '!=...
            3 IllegalArgumentException: invalid argument: found PARTITION at 295:304 expected '.', '[', '::', 'ESCAPE', 'IS', 'NOT', 'IN', '*', '/', '%', 'DIV', '+', '-', '||', '>>>', '>>', '<<', '&', '^', '|', '!=...
            3 IllegalArgumentException: invalid argument: found PARTITION at 59:68 expected '.', '[', '::', 'ESCAPE', 'IS', 'NOT', 'IN', '*', '/', '%', 'DIV', '+', '-', '||', '>>>', '>>', '<<', '&', '^', '|', '!=',...
            3 IllegalArgumentException: invalid argument: found WITH at 171:175 expected '.', '[', '::', 'ESCAPE', 'IS', 'NOT', 'IN', '*', '/', '%', 'DIV', '+', '-', '||', '>>>', '>>', '<<', '&', '^', '|', '!=', '!...
            3 IllegalArgumentException: invalid argument: found WITH at 279:283 expected '.', '[', '::', 'ESCAPE', 'IS', 'NOT', 'IN', '*', '/', '%', 'DIV', '+', '-', '||', '>>>', '>>', '<<', '&', '^', '|', '!=', '!...
            3 IllegalArgumentException: invalid argument: invalid PySpark UDF type: 211
            3 IllegalArgumentException: invalid argument: invalid PySpark UDF type: 215
            3 UnsupportedOperationException: cached remote relation
            3 UnsupportedOperationException: function: from_json
            3 UnsupportedOperationException: handle analyze input files
            3 UnsupportedOperationException: pivot
            3 UnsupportedOperationException: table argument options in subquery expression
            3 UnsupportedOperationException: unknown function: distributed_sequence_id
            3 ValueError: Converting to Python dictionary is not supported when duplicate field names are present
            2 AnalysisException: Failed to coerce arguments to satisfy a call to 'approx_percentile_cont' function: coercion from Float64, List(Float64), Int32 to the signature OneOf([Exact([Int8, Float64]), Exact(...
            2 AnalysisException: No table format found for: orc
            2 AnalysisException: ambiguous attribute: ObjectName([Identifier("id")])
            2 AnalysisException: not supported: function exists
            2 AnalysisException: not supported: list functions
            2 AnalysisException: temporary view not found: variant_table
            2 AnalysisException: two values expected: [Column(Column { relation: None, name: "#2" }), Column(Column { relation: None, name: "#3" }), Literal(Utf8("/"), None)]
            2 AssertionError: ".*constructor has more than one argument.*" does not match "
            2 AssertionError: "ARROW_TYPE_MISMATCH.*SQL_MAP_ARROW_ITER_UDF" does not match "Invalid argument error: column types must match schema types, expected Int32 but found Int64 at column index 0"
            2 AssertionError: "AttributeError: 'int' object has no attribute 'corr'" does not match "
            2 AssertionError: "Exception thrown when converting pandas.Series" does not match "
            2 AssertionError: "NO_ACTIVE_SESSION" does not match "
            2 AssertionError: "\[UDTF_EXEC_ERROR\] User defined table function encountered an error in the '__init__' method: error" does not match "
            2 AssertionError: "\[UDTF_EXEC_ERROR\] User defined table function encountered an error in the 'eval' method: error" does not match "
            2 AssertionError: "\[UDTF_EXEC_ERROR\] User defined table function encountered an error in the 'terminate' method: terminate error" does not match "
            2 AssertionError: "eval error" does not match "
            2 AssertionError: "missing a required argument" does not match "
            2 AssertionError: "terminate error" does not match "
            2 AssertionError: "terminate\(\) missing 1 required positional argument: 'a'" does not match "
            2 AssertionError: 3 != 0 : dict_keys([])
            2 AssertionError: {'foo': 'bar'} != {}
            2 IllegalArgumentException: invalid argument: found FUNCTION at 7:15 expected 'DATABASE', 'SCHEMA', 'OR', 'TEMP', 'TEMPORARY', 'EXTERNAL', 'TABLE', 'GLOBAL', or 'VIEW'
            2 IllegalArgumentException: invalid argument: invalid PySpark UDF type: 213
            2 IllegalArgumentException: missing argument: Python UDF output type
            2 PySparkAssertionError: [DIFFERENT_ROWS] Results do not match: ( 99.50000 % )
            2 PythonException:  AssertionError: assert None is not None
            2 PythonException:  AttributeError: 'NoneType' object has no attribute 'cpus'
            2 PythonException:  PySparkRuntimeError: [UDTF_EVAL_METHOD_ARGUMENTS_DO_NOT_MATCH_SIGNATURE] Failed to evaluate the user-defined table function '' because the function arguments did not match the expect...
            2 SparkRuntimeException: Error during planning: Correlated scalar subquery must be aggregated to return at most one row
            2 SparkRuntimeException: Python error: [TestDataSource::partitions] NotImplementedError: 
            2 SparkRuntimeException: Python error: [my-json::partitions] AttributeError: 'pyarrow.lib.Schema' object has no attribute 'fieldNames'
            2 TypeError: 'NoneType' object is not iterable
            2 UnsupportedOperationException: Aggregate can not be used as a sliding accumulator because `retract_batch` is not implemented: avg@8jjv77o85l4r1u661eucb9ylm(#9) PARTITION BY [#8] ORDER BY [#9 ASC NULLS...
            2 UnsupportedOperationException: Aggregate can not be used as a sliding accumulator because `retract_batch` is not implemented: mean_udf@4jfgqif5e847nsiw7pwudti7o(#3) PARTITION BY [#2] ORDER BY [#3 ASC ...
            2 UnsupportedOperationException: CLUSTER BY for write
            2 UnsupportedOperationException: LATERAL JOIN with criteria
            2 UnsupportedOperationException: Physical plan does not support logical expression ScalarSubquery(<subquery>)
            2 UnsupportedOperationException: Physical plan does not support logical expression Wildcard { qualifier: None, options: WildcardOptions { ilike: None, exclude: None, except: None, replace: None, rename:...
            2 UnsupportedOperationException: cast Time64(Nanosecond) to Spark data type
            2 UnsupportedOperationException: create resource profile command
            2 UnsupportedOperationException: function: from_xml
            2 UnsupportedOperationException: function: to_variant_object
            2 UnsupportedOperationException: function: try_make_interval
            2 UnsupportedOperationException: function: try_parse_json
            2 UnsupportedOperationException: function: uniform
            2 UnsupportedOperationException: handle analyze is local
            2 UnsupportedOperationException: handle analyze same semantics
            2 UnsupportedOperationException: unknown function: st_setsrid
            2 UnsupportedOperationException: unknown function: st_srid
            2 UnsupportedOperationException: unknown function: try_to_date
            2 UnsupportedOperationException: unknown function: try_to_time
            2 UnsupportedOperationException: wildcard with plan ID
            2 UnsupportedOperationException: with watermark
            2 handle artifact statuses
            1 AnalysisException: Cannot cast string 'abc' to value of Float64 type
(+1)        1 AnalysisException: Cannot cast struct with 2 fields to 2 fields because there is no field name overlap
            1 AnalysisException: Cannot cast value 'abc' to value of Boolean type
            1 AnalysisException: Could not find config namespace "mapred"
            1 AnalysisException: Could not find config namespace "spark"
            1 AnalysisException: Error parsing timestamp from '082017' using format '%m%Y': input is not enough for unique date and time
            1 AnalysisException: Error parsing timestamp from '2014-31-12' using format '%Y-%d-%pa': input contains invalid characters
            1 AnalysisException: Error parsing timestamp from '2023-01-01' using format '%d-%m-%Y': input contains invalid characters
            1 AnalysisException: Invalid partition id 1 in write result (expected < 1)
(+1)        1 AnalysisException: Invalid partition id 3 in write result (expected < 1)
            1 AnalysisException: No files found in the specified paths: file:///home/runner/work/sail/sail/.venvs/test-spark.spark-4.1.1/lib/python3.11/site-packages/pyspark/sql/functions/builtin.py
(+1)        1 AnalysisException: No files found in the specified paths: file:///tmp/test_multi_paths16fbmmiz9/text-0.text, file:///tmp/test_multi_paths16fbmmiz9/text-1.text, file:///tmp/test_multi_paths16fbmmiz9/te...
(+1)        1 AnalysisException: No files found in the specified paths: file:///tmp/tmpqq19_6fm/
(+1)        1 AnalysisException: No files found in the specified paths: file:///tmp/tmprpwubkb7/
            1 AnalysisException: No table format found for: xml
(+1)        1 AnalysisException: UNION queries have different number of columns: left has 3 columns whereas right has 2 columns
            1 AnalysisException: Write failed for partition 1: External error: Python error: [TestJsonWriter::write] AttributeError: 'NoneType' object has no attribute 'partitionId'
(+1)        1 AnalysisException: Write failed for partition 2: External error: Python error: [TestJsonWriter::write] AttributeError: 'NoneType' object has no attribute 'partitionId'
            1 AnalysisException: ambiguous attribute: ObjectName([Identifier("b")])
            1 AnalysisException: ambiguous attribute: ObjectName([Identifier("i")])
            1 AnalysisException: cannot resolve attribute: ObjectName([Identifier("x")])
            1 AnalysisException: database not found: testcat
            1 AnalysisException: element_at expects List or Map type as first argument, got Null
            1 AnalysisException: one value expected: [Column(Column { relation: None, name: "#0" }), Literal(Int32(123), None)]
(+1)        1 AnalysisException: one value expected: [Column(Column { relation: None, name: "#1" }), Literal(Int64(6254863060145208661), None)]
(+1)        1 AnalysisException: one value expected: [Column(Column { relation: None, name: "#1" }), Literal(Int64(7162504282234123516), None)]
            1 AnalysisException: table already exists: tbl1
            1 AnalysisException: temporary view not found: tab2
            1 AnalysisException: to_time format argument 2 must be a scalar, not an array
            1 AnalysisException: too big
            1 AnalysisException: zero values expected: [Literal(Int32(123), None)]
(+1)        1 AssertionError: "'path' is not specified." does not match "Generic LocalFileSystem error: Unable to open file /ndtFKZmaC1lFowx5_0.zst.parquet#1: Permission denied (os error 13)"
            1 AssertionError: "ARROW_TYPE_MISMATCH.*SQL_MAP_ARROW_ITER_UDF" does not match "Invalid argument error: column types must match schema types, expected Struct("b": Int32) but found Struct("a": Int64, "b"...
            1 AssertionError: "Column names of the returned pandas.DataFrame do not match specified schema. Missing: id. Unexpected: iid. PySparkRuntimeError: [RESULT_COLUMNS_MISMATCH_FOR_PANDAS_UDF] Column names o...
            1 AssertionError: "Column names of the returned pandas.DataFrame do not match specified schema. Missing: mean. Unexpected: median, std. PySparkRuntimeError: [RESULT_COLUMNS_MISMATCH_FOR_PANDAS_UDF] Colu...
            1 AssertionError: "Column names of the returned pyarrow.Table do not match specified schema. Missing: m.
            1 AssertionError: "Column names of the returned pyarrow.Table do not match specified schema. Missing: m. TypeError: object of type 'generator' has no len()
            1 AssertionError: "Column names of the returned pyarrow.Table do not match specified schema. Missing: m. Unexpected: v, v2.
            1 AssertionError: "Column names of the returned pyarrow.Table do not match specified schema. Missing: m. Unexpected: v, v2. TypeError: object of type 'generator' has no len()
            1 AssertionError: "Columns do not match in their data type: column 'a' \(expected int32, actual int64\)" does not match "
            1 AssertionError: "Columns do not match in their data type: column 'a' \(expected int32, actual int64\)" does not match " TypeError: object of type 'generator' has no len()
            1 AssertionError: "Columns do not match in their data type: column 'id' \(expected int32, actual int64\)" does not match "
            1 AssertionError: "Columns do not match in their data type: column 'id' \(expected int32, actual int64\)" does not match " TypeError: object of type 'generator' has no len()
            1 AssertionError: "DATA_SOURCE_EXTRANEOUS_FILTERS" does not match "Python error: [test::partitions] AssertionError: assert False
            1 AssertionError: "DATA_SOURCE_PUSHDOWN_DISABLED" does not match "Python error: [<reader>::read] AssertionError: assert False
(+1)        1 AssertionError: "Database 'memory:67574fd1-7fe5-47b1-bc5a-2c3d1dc35162' dropped." does not match "No table format found for: jdbc"
(+1)        1 AssertionError: "Database 'memory:70718f8e-fe7f-4e70-9ca3-0936e4c002b0' dropped." does not match "No table format found for: jdbc"
            1 AssertionError: "Invalid return type" does not match " AttributeError: 'Series' object has no attribute 'columns'
            1 AssertionError: "My error" does not match "
            1 AssertionError: "Number of columns of the returned pandas.DataFrame doesn't match specified schema. Expected: 2 Actual: 3 PySparkRuntimeError: [RESULT_LENGTH_MISMATCH_FOR_PANDAS_UDF] Number of columns...
            1 AssertionError: "PySparkValueError: Exception thrown when converting pandas.Series \(object\) with name 'id' to Arrow Array \(int32\)\." does not match "
            1 AssertionError: "Python worker process terminated due to idle timeout \(timeout: 1 seconds\)" does not match " PySparkRuntimeError: [UDTF_INVALID_OUTPUT_ROW_TYPE] The type of an individual output row ...
            1 AssertionError: "Result vector from pandas_udf was not the required length" does not match "
            1 AssertionError: "Return type of the user-defined function should be pandas.DataFrame, but is int" does not match " PySparkTypeError: [UDF_RETURN_TYPE] Return typ (truncated)"
            1 AssertionError: "Return type of the user-defined function should be pyarrow.Table, but is tuple" does not match "
            1 AssertionError: "Return type of the user-defined function should be pyarrow.Table, but is tuple" does not match " TypeError: object of type 'generator' has no len()
            1 AssertionError: "Return.*type.*Series" does not match "
            1 AssertionError: "UNRESOLVED_COLUMN.WITH_SUGGESTION" does not match "cannot resolve attribute: ObjectName([Identifier("b")])"
            1 AssertionError: "ValueError: Exception thrown when converting pandas.Series \(object\) with name 'id' to Arrow Array \(double\). It can be caused by overflows or other unsafe conversions warned by Arr...
            1 AssertionError: "ValueError: Exception thrown when converting pandas.Series \(object\) with name 'k' to Arrow Array \(double\). It can be caused by overflows or other unsafe conversions warned by Arro...
            1 AssertionError: "ValueError: Exception thrown when converting pandas.Series \(object\) with name 'mean' to Arrow Array \(double\). It can be caused by overflows or other unsafe conversions warned by A...
            1 AssertionError: "\[UDTF_EXEC_ERROR\] User defined table function encountered an error in the 'eval' method: error" does not match " Exception: error
            1 AssertionError: "\[UDTF_EXEC_ERROR\] User defined table function encountered an error in the 'terminate' method: terminate error" does not match " ValueError: terminate error
            1 AssertionError: "division( or modulo)? by zero" does not match "
            1 AssertionError: "foobar" does not match "raise_error expects a single UTF-8 string argument"
            1 AssertionError: "is null" does not match " ArrowException: Invalid argument error: Column 'a' is declared as non-nullable but contains null values
            1 AssertionError: "requirement failed: Cogroup keys must have same size: 2 != 1" does not match "invalid argument: child plan grouping expressions must have the same length"
            1 AssertionError: "timestamp values are not equal (timestamp='1968-12-31 17:01:01': data[0][1]='1969-01-01 01:01:01')" is not None
            1 AssertionError: '+--------------------------------+-------------------[411 chars]-+\n' != '+-----------+-----------+\n|from_csv(a)|from_csv(b)|\[105 chars]-+\n'
            1 AssertionError: '+---[17 chars]-----+\n|                        x|\n+--------[132 chars]-+\n' != '+---[17 chars]----------+\n|update_fields(x, WithField(e))|\[167 chars]-+\n'
            1 AssertionError: '+---[23 chars]---+-----+\n|  1|    1|\n+---+-----+\nonly showing top 1 row' != '+---[23 chars]---+-----+\n|  1|    1|\n+---+-----+\nonly showing top 1 row\n'
            1 AssertionError: 'INVALID_CLONE_SESSION_REQUEST.TARGET_SESSION_ID_FORMAT' not found in '<_InactiveRpcError of RPC that terminated with:\n\tstatus = StatusCode.UNIMPLEMENTED\n\tdetails = "clone session"...
            1 AssertionError: 'ST_INVALID_SRID_VALUE' != None : Expected error class was 'ST_INVALID_SRID_VALUE', got 'None'.
            1 AssertionError: 'UNSUPPORTED_SUBQUERY_EXPRESSION_CATEGORY.UNSUPPORTED_IN_EXISTS_SUBQUERY' != None : Expected error class was 'UNSUPPORTED_SUBQUERY_EXPRESSION_CATEGORY.UNSUPPORTED_IN_EXISTS_SUBQUERY', ...
            1 AssertionError: 'a NULL, b BOOLEAN, c BINARY' != 'a VOID,b BOOLEAN,c BINARY'
            1 AssertionError: 'bytearray' != 'bytes'
            1 AssertionError: 0 not greater than 0
            1 AssertionError: 0.6363787615254752 != 0.9531453492357947 : Column<'rand(1)'>
            1 AssertionError: 2 != 6
            1 AssertionError: 6 != 0 : []
            1 AssertionError: ArrayIndexOutOfBoundsException not raised
            1 AssertionError: Exception not raised by <lambda>
            1 AssertionError: Lists differ: [(1, 2), (3, 4), (None, 5), (0, 0)] != [(1, 2), (3, 4), (None, 5), (None, None)]
            1 AssertionError: Lists differ: [Row([14 chars] _c1=25, _c2='I am Hyukjin\n\nI love Spark!'),[86 chars]om')] != [Row([14 chars] _c1='25', _c2='I am Hyukjin\n\nI love Spark!'[92 chars]om')]
            1 AssertionError: Lists differ: [Row([24 chars]2019, 1, 1, 8, 0), aware=datetime.datetime(2019, 1, 1, 16, 0))] != [Row([24 chars]2019, 1, 1, 0, 0), aware=datetime.datetime(2019, 1, 1, 16, 0))]
            1 AssertionError: Lists differ: [Row([259 chars]681098, ln(id)=1.0986122886681098, struct(id, [975 chars]0'))] != [Row([259 chars]681096, ln(id)=1.0986122886681096, struct(id, [975 chars]0'))]
            1 AssertionError: Lists differ: [Row(id=90, name='90'), Row(id=91, name='91'), Ro[176 chars]99')] != [Row(id=15, name='15'), Row(id=16, name='16'), Ro[176 chars]24')]
            1 AssertionError: Lists differ: [Row(key='0'), Row(key='1'), Row(key='10'), Row(ke[1435 chars]99')] != [Row(key=0), Row(key=1), Row(key=10), Row(key=11),[1235 chars]=99)]
            1 AssertionError: Lists differ: [Row(name='Andy', age=30), Row(name='Justin', [34 chars]one)] != [Row(_corrupt_record=' "age":19}\n', name=None[104 chars]el')]
            1 AssertionError: Row(point='[1.0, 2.0]', pypoint='[3.0, 4.0]') != Row(point='(1.0, 2.0)', pypoint='[3.0, 4.0]')
            1 AssertionError: SparkConnectGrpcException not raised
            1 AssertionError: StorageLevel(False, True, True, False, 1) != StorageLevel(False, False, False, False, 1)
            1 AssertionError: Struc[30 chars]estampType(), True), StructField('val', IntegerType(), True)]) != Struc[30 chars]estampType(), True), StructField('val', IntegerType(), False)])
            1 AssertionError: Struc[32 chars]e(), False), StructField('b', DoubleType(), Fa[158 chars]ue)]) != Struc[32 chars]e(), True), StructField('b', DoubleType(), Tru[154 chars]ue)])
            1 AssertionError: Struc[40 chars]ue), StructField('val', ArrayType(DoubleType(), False), True)]) != Struc[40 chars]ue), StructField('val', PythonOnlyUDT(), True)])
            1 AssertionError: True is not false : Default URL is not secure
            1 AssertionError: YearMonthIntervalType(0, 1) != YearMonthIntervalType(0, 0)
            1 AssertionError: [1.0, 2.0] != ExamplePoint(1.0,2.0)
            1 AssertionError: datetime.datetime(1970, 1, 1, 0, 0) != datetime.datetime(1970, 1, 1, 8, 0)
            1 AttributeError: 'NoneType' object has no attribute 'extract_graph'
            1 AttributeError: 'NoneType' object has no attribute 'toText'
            1 FileNotFoundError: [Errno 2] No such file or directory: '/home/runner/work/sail/sail/.venvs/test-spark.spark-4.1.1/lib/python3.11/site-packages/pyspark/data/artifact-tests/junitLargeJar.jar'
(+1)        1 FileNotFoundError: [Errno 2] No such file or directory: '/tmp/tmpp2k7vi9o'
            1 IllegalArgumentException: invalid argument: empty data type
            1 IllegalArgumentException: invalid argument: expecting column to drop
            1 IllegalArgumentException: invalid argument: field not found in input schema: col1
            1 IllegalArgumentException: invalid argument: found abc at 0:3 expected something else, ';', statement, or end of input
            1 IllegalArgumentException: invalid argument: found collate at 13:20 expected string, '.', '[', '::', 'ESCAPE', 'IS', 'NOT', 'IN', '*', '/', '%', 'DIV', '+', '-', '||', '>>>', '>>', '<<', '&', '^', '|',...
            1 IllegalArgumentException: invalid argument: grouping sets with grouping expressions
            1 IllegalArgumentException: invalid argument: invalid PySpark UDF type: 212
            1 IllegalArgumentException: invalid argument: invalid PySpark UDF type: 214
            1 IllegalArgumentException: invalid argument: invalid user-defined window function type
            1 IllegalArgumentException: invalid argument: table does not exist: ObjectName([Identifier("test_table")])
(+1)        1 PySparkAssertionError: Received incorrect server side session identifier for request. Please create a new Spark Session to reconnect. (1f448e20-6257-4674-968e-1dafc3d616f8 != 49d49023-5ffc-4357-8515-2...
(+1)        1 PySparkAssertionError: Received incorrect server side session identifier for request. Please create a new Spark Session to reconnect. (f95ff4f5-16c8-441f-a39f-9ef3c2bb1ddc != fb0207f2-bb62-47c9-bb70-d...
            1 PySparkNotImplementedError: [NOT_IMPLEMENTED] rdd is not implemented.
            1 PySparkNotImplementedError: [NOT_IMPLEMENTED] toJSON() is not implemented.
            1 PySparkTypeError: [UNSUPPORTED_DATA_TYPE_FOR_ARROW_CONVERSION] binary_view is not supported in conversion to Arrow.
            1 PythonException:  AttributeError: 'NoneType' object has no attribute 'partitionId'
            1 PythonException:  KeyError: 'a'
            1 PythonException:  TypeError: net.razorvine.pickle.PickleException: expected zero arguments for construction of ClassDict (for pyspark.sql.types._create_row).
            1 SparkRuntimeException: Assertion failed: !args.is_empty(): args should not be empty
            1 SparkRuntimeException: Assertion failed: compatible: Failed due to a difference in schemas: original schema: DFSchema { inner: Schema { fields: [Field { name: "#0", data_type: Int64, nullable: true },...
            1 SparkRuntimeException: Compute error: Cannot perform a binary operation on arrays of different length
            1 SparkRuntimeException: Exception: path is not specified
            1 SparkRuntimeException: Execution error: Schema field count mismatch: expected 1 fields, got 2
            1 SparkRuntimeException: Internal error: Cannot run range queries on datatype: Time64(µs).
            1 SparkRuntimeException: Invalid argument error: column types must match schema types, expected Int64 but found List(Int64) at column index 1
            1 SparkRuntimeException: Invalid argument error: column types must match schema types, expected LargeUtf8 but found Utf8 at column index 0
            1 SparkRuntimeException: Invalid argument error: must either specify a row count or at least one column
            1 SparkRuntimeException: Invalid argument error: number of columns(3) must match number of fields(2) in schema
            1 SparkRuntimeException: Json error: Not valid JSON: EOF while parsing a list at line 1 column 1
            1 SparkRuntimeException: Json error: Not valid JSON: expected value at line 1 column 2
            1 SparkRuntimeException: Parser error: Error while parsing value '0
            1 SparkRuntimeException: Python error: [TestArrowStreamWriter::writer] PySparkNotImplementedError: [NOT_IMPLEMENTED] writer is not implemented.
            1 SparkRuntimeException: Python error: [TestDataSource::writer] PySparkNotImplementedError: [NOT_IMPLEMENTED] writer is not implemented.
            1 SparkRuntimeException: Python error: [my-json::writer] AttributeError: 'pyarrow.lib.Schema' object has no attribute 'fieldNames'
            1 SparkRuntimeException: Python error: [test::partitions] AssertionError: assert False
            1 SparkRuntimeException: Python error: [testdatasourcepyarrow::partitions] PySparkNotImplementedError: [NOT_IMPLEMENTED] reader is not implemented.
            1 SparkRuntimeException: Schema error: Failed to parse DDL schema 'a INT, b INT, c VARIANT, d STRUCT<v VARIANT>, e ARRAY<VARIANT>,f MAP<STRING, VARIANT>': error in SQL parser: found VARIANT at 23:30 exp...
            1 SparkRuntimeException: Schema error: Unsupported type in DDL schema: List { data_type: Int32, nullable: true }. Use PyArrow Schema for complex types.
            1 SparkRuntimeException: Schema error: Unsupported type in DDL schema: Struct { fields: Fields([Field { name: "a", data_type: Int32, nullable: true, metadata: [] }, Field { name: "b", data_type: Int32, ...
            1 SparkRuntimeException: Schema error: Unsupported type in DDL schema: Struct { fields: Fields([Field { name: "y", data_type: Int32, nullable: true, metadata: [] }]) }. Use PyArrow Schema for complex ty...
            1 SparkRuntimeException: This feature is not implemented: Data type Decimal128(38, 18) not supported in row-based write path. Use DataSourceArrowWriter for full type support.
            1 UnsupportedOperationException: Aggregate can not be used as a sliding accumulator because `retract_batch` is not implemented: avg@8jjv77o85l4r1u661eucb9ylm(#9) PARTITION BY [#8] ORDER BY [#9 ASC NULLS...
            1 UnsupportedOperationException: Aggregate can not be used as a sliding accumulator because `retract_batch` is not implemented: avg@8jjv77o85l4r1u661eucb9ylm(plus_one@8f9fwaevnfdj031wzemmraerh(#9)) PART...
            1 UnsupportedOperationException: Physical plan does not support logical expression AggregateFunction(AggregateFunction { func: AggregateUDF { inner: PySparkGroupAggregateUDF { signature: Signature { typ...
            1 UnsupportedOperationException: PlanNode::ClearCache
            1 UnsupportedOperationException: PlanNode::IsCached
            1 UnsupportedOperationException: PlanNode::RecoverPartitions
            1 UnsupportedOperationException: SHOW FUNCTIONS
            1 UnsupportedOperationException: Support for 'approx_distinct' for data type Float64 is not implemented
            1 UnsupportedOperationException: Support for 'approx_distinct' for data type Struct("name": Utf8, "value": Int64) is not implemented
            1 UnsupportedOperationException: as of join
            1 UnsupportedOperationException: bucketing for writing listing table format
            1 UnsupportedOperationException: deduplicate within watermark
            1 UnsupportedOperationException: function: collate
            1 UnsupportedOperationException: function: collation
            1 UnsupportedOperationException: function: java_method
            1 UnsupportedOperationException: function: json_tuple
            1 UnsupportedOperationException: function: reflect
            1 UnsupportedOperationException: function: regexp_extract_all
            1 UnsupportedOperationException: function: schema_of_csv
            1 UnsupportedOperationException: function: schema_of_json
            1 UnsupportedOperationException: function: schema_of_xml
            1 UnsupportedOperationException: function: sentences
            1 UnsupportedOperationException: function: session_window
            1 UnsupportedOperationException: function: to_char
            1 UnsupportedOperationException: function: to_csv
            1 UnsupportedOperationException: function: to_varchar
            1 UnsupportedOperationException: function: to_xml
            1 UnsupportedOperationException: function: try_reflect
            1 UnsupportedOperationException: function: xpath
            1 UnsupportedOperationException: function: xpath_boolean
            1 UnsupportedOperationException: function: xpath_double
            1 UnsupportedOperationException: function: xpath_float
            1 UnsupportedOperationException: function: xpath_int
            1 UnsupportedOperationException: function: xpath_long
            1 UnsupportedOperationException: function: xpath_number
            1 UnsupportedOperationException: function: xpath_short
            1 UnsupportedOperationException: function: xpath_string
            1 UnsupportedOperationException: handle analyze semantic hash
            1 UnsupportedOperationException: named window function arguments
            1 UnsupportedOperationException: unknown aggregate function: bitmap_construct_agg
            1 UnsupportedOperationException: unknown aggregate function: bitmap_or_agg
            1 UnsupportedOperationException: unknown aggregate function: count_min_sketch
            1 UnsupportedOperationException: unknown aggregate function: grouping_id
            1 UnsupportedOperationException: unknown function: bitmap_and_agg
            1 UnsupportedOperationException: unknown function: product
            1 UnsupportedOperationException: unknown function: quote
            1 UnsupportedOperationException: unknown function: timestampadd
            1 UnsupportedOperationException: unknown function: timestampdiff
            1 UnsupportedOperationException: unknown function: unwrap_udt
            1 UnsupportedOperationException: unknown window function: pd_win_max
            1 ValueError: The column label 'id' is not unique.
            1 ValueError: The column label 'struct' is not unique.
            1 failed to decode Protobuf message: WithColumns.input: Relation.rel_type: WithColumns.input: Relation.rel_type: WithColumns.input: Relation.rel_type: WithColumns.input: Relation.rel_type: WithColumns.i...
            1 handle add artifacts
(-1)        0 AnalysisException: Invalid partition id 2 in write result (expected < 1)
(-1)        0 AnalysisException: No files found in the specified paths: file:///tmp/test_multi_paths1inmqwswe/text-0.text, file:///tmp/test_multi_paths1inmqwswe/text-1.text, file:///tmp/test_multi_paths1inmqwswe/te...
(-1)        0 AnalysisException: No files found in the specified paths: file:///tmp/tmp9eqyhxwm/
(-1)        0 AnalysisException: No files found in the specified paths: file:///tmp/tmpe1no52c2/
(-1)        0 AnalysisException: UNION queries have different number of columns: left has 2 columns whereas right has 3 columns
(-1)        0 AnalysisException: Write failed for partition 0: External error: Python error: [TestJsonWriter::write] AttributeError: 'NoneType' object has no attribute 'partitionId'
(-1)        0 AnalysisException: one value expected: [Column(Column { relation: None, name: "#1" }), Literal(Int64(1462217764685989819), None)]
(-1)        0 AnalysisException: one value expected: [Column(Column { relation: None, name: "#1" }), Literal(Int64(5700579565814582232), None)]
(-1)        0 AssertionError: "'path' is not specified." does not match "Generic LocalFileSystem error: Unable to open file /ba7YvLeMncAoRWHA_0.zst.parquet#1: Permission denied (os error 13)"
(-1)        0 AssertionError: "Database 'memory:299520f4-3baf-47a9-8577-c59d26f7aaba' dropped." does not match "No table format found for: jdbc"
(-1)        0 AssertionError: "Database 'memory:e8580f07-2e82-49a2-b0b2-9179aee4164c' dropped." does not match "No table format found for: jdbc"
(-1)        0 FileNotFoundError: [Errno 2] No such file or directory: '/tmp/tmp28h50cy9'
(-1)        0 PySparkAssertionError: Received incorrect server side session identifier for request. Please create a new Spark Session to reconnect. (6af6dc92-4895-4bb4-9a8b-6dcf9a85a006 != 7a55a2b6-25b1-47ec-a39f-f...
(-1)        0 PySparkAssertionError: Received incorrect server side session identifier for request. Please create a new Spark Session to reconnect. (cb722134-364c-491b-a2d2-548f66dd8854 != edcf10a6-90bc-4d78-a014-8...
(-1)        0 SparkRuntimeException: Error during planning: expr type Struct("col1": Struct("a": Int64, "b": Float64)) can't cast to Struct("a": Int64, "b": Float64) in InSubquery

Passed Tests Diff

--- before.txt	2026-03-25 11:27:07.897123861 +0000
+++ after.txt	2026-03-25 11:27:08.346126989 +0000
@@ -146 +145,0 @@
-pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.array_compact

Failed Tests

pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.cacheTable
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.clearCache
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.createTable
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.functionExists
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.getFunction
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.isCached
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.listCatalogs
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.listFunctions
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.recoverPartitions
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.refreshByPath
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.refreshTable
pyspark/sql/catalog.py::pyspark.sql.catalog.Catalog.uncacheTable
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame._joinAsOf
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.approxQuantile
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.asTable
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.cache
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.coalesce
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.colRegex
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.dropDuplicatesWithinWatermark
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.explain
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.freqItems
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.groupingSets
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.hint
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.inputFiles
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.isLocal
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.isStreaming
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.lateralJoin
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.localCheckpoint
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.mapInArrow
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.observe
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.pandas_api
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.persist
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.randomSplit
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.rdd
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.repartition
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.repartitionById
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.repartitionByRange
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.sameSemantics
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.sampleBy
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.storageLevel
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.toJSON
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.transpose
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrame.withWatermark
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrameStatFunctions.approxQuantile
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrameStatFunctions.freqItems
pyspark/sql/dataframe.py::pyspark.sql.dataframe.DataFrameStatFunctions.sampleBy
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.aggregate
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.approx_count_distinct
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.approx_percentile
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.array_compact
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.array_sort
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.assert_true
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.bitmap_and_agg
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.bitmap_construct_agg
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.bitmap_or_agg
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.collation
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.corr
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.cosh
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.count_if
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.count_min_sketch
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.degrees
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.exists
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.exp
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.filter
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.first
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.forall
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.from_csv
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.from_json
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.from_xml
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.get_json_object
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.grouping_id
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.hash
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.histogram_numeric
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.hll_sketch_agg
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.hll_sketch_estimate
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.hll_union
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.hll_union_agg
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.hour
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.ilike
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.inline_outer
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.input_file_block_length
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.input_file_block_start
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.input_file_name
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.is_variant_null
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.java_method
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.json_tuple
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_agg_bigint
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_agg_double
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_agg_float
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_get_n_bigint
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_get_n_double
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_get_n_float
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_get_quantile_bigint
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_get_quantile_double
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_get_quantile_float
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_get_rank_bigint
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_get_rank_double
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_get_rank_float
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_merge_bigint
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_merge_double
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_merge_float
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_to_string_bigint
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_to_string_double
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kll_sketch_to_string_float
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.kurtosis
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.like
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.log2
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.make_timestamp
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.make_timestamp_ntz
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.map_filter
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.map_zip_with
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.minute
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.mode
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.monotonically_increasing_id
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.parse_json
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.percentile
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.percentile_approx
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.product
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.quote
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.randn
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.randstr
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.reduce
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.reflect
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.regexp_extract
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.regexp_extract_all
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.rlike
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.schema_of_csv
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.schema_of_json
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.schema_of_variant
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.schema_of_variant_agg
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.schema_of_xml
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.second
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.sentences
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.session_window
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.shuffle
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.sin
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.spark_partition_id
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.st_setsrid
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.st_srid
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.tan
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.theta_difference
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.theta_intersection
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.theta_intersection_agg
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.theta_sketch_agg
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.theta_sketch_estimate
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.theta_union
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.theta_union_agg
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.timestamp_add
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.timestamp_diff
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.to_char
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.to_csv
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.to_json
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.to_time
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.to_varchar
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.to_variant_object
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.to_xml
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.transform
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.transform_keys
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.transform_values
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.try_add
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.try_avg
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.try_make_interval
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.try_make_timestamp
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.try_parse_json
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.try_parse_url
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.try_reflect
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.try_subtract
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.try_to_date
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.try_to_time
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.try_variant_get
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.udf
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.udtf
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.uniform
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.unwrap_udt
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.uuid
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.variant_get
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.window
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.window_time
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.xpath
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.xpath_boolean
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.xpath_double
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.xpath_float
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.xpath_int
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.xpath_long
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.xpath_number
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.xpath_short
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.xpath_string
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.xxhash64
pyspark/sql/functions/builtin.py::pyspark.sql.functions.builtin.zip_with
pyspark/sql/tests/connect/arrow/test_parity_arrow.py::ArrowParityTests::test_createDataFrame_pandas_duplicate_field_names
pyspark/sql/tests/connect/arrow/test_parity_arrow.py::ArrowParityTests::test_pandas_self_destruct
pyspark/sql/tests/connect/arrow/test_parity_arrow.py::ArrowParityTests::test_propagates_spark_exception
pyspark/sql/tests/connect/arrow/test_parity_arrow.py::ArrowParityTests::test_toPandas_duplicate_field_names
pyspark/sql/tests/connect/arrow/test_parity_arrow_cogrouped_map.py::CogroupedMapInArrowParityTests::test_apply_in_arrow_not_returning_arrow_table
pyspark/sql/tests/connect/arrow/test_parity_arrow_cogrouped_map.py::CogroupedMapInArrowParityTests::test_apply_in_arrow_returning_empty_dataframe_and_wrong_column_names
pyspark/sql/tests/connect/arrow/test_parity_arrow_cogrouped_map.py::CogroupedMapInArrowParityTests::test_apply_in_arrow_returning_wrong_column_names
pyspark/sql/tests/connect/arrow/test_parity_arrow_cogrouped_map.py::CogroupedMapInArrowParityTests::test_apply_in_arrow_returning_wrong_types
pyspark/sql/tests/connect/arrow/test_parity_arrow_cogrouped_map.py::CogroupedMapInArrowParityTests::test_apply_in_arrow_returning_wrong_types_positional_assignment
pyspark/sql/tests/connect/arrow/test_parity_arrow_cogrouped_map.py::CogroupedMapInArrowParityTests::test_cogroup_apply_in_arrow_with_logging
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_apply_in_arrow
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_apply_in_arrow_batching
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_apply_in_arrow_column_order
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_apply_in_arrow_empty_groupby
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_apply_in_arrow_iter_with_logging
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_apply_in_arrow_not_returning_arrow_table
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_apply_in_arrow_partial_iteration
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_apply_in_arrow_returning_empty_dataframe
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_apply_in_arrow_returning_empty_dataframe_and_wrong_column_names
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_apply_in_arrow_returning_wrong_column_names
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_apply_in_arrow_returning_wrong_types
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_apply_in_arrow_returning_wrong_types_positional_assignment
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_apply_in_arrow_with_key
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_apply_in_arrow_with_logging
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_arrow_batch_slicing
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_negative_and_zero_batch_size
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_positional_assignment_conf
pyspark/sql/tests/connect/arrow/test_parity_arrow_grouped_map.py::ApplyInArrowParityTests::test_self_join
pyspark/sql/tests/connect/arrow/test_parity_arrow_map.py::ArrowMapParityTests::test_map_in_arrow_with_barrier_mode
pyspark/sql/tests/connect/arrow/test_parity_arrow_map.py::ArrowMapParityTests::test_map_in_arrow_with_logging
pyspark/sql/tests/connect/arrow/test_parity_arrow_map.py::ArrowMapParityTests::test_nested_extraneous_field
pyspark/sql/tests/connect/arrow/test_parity_arrow_map.py::ArrowMapParityTests::test_nullability_widen
pyspark/sql/tests/connect/arrow/test_parity_arrow_map.py::ArrowMapParityTests::test_top_level_wrong_order
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_arrow_udf_int_to_decimal_coercion
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_chained_udfs_with_variant
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_complex_input_types
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_complex_return_types
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_day_time_interval_in_struct
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_day_time_interval_type_casting
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_decimal_round
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_file_dsv2_with_udf_filter
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_kwargs
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_multiple_udfs_with_logging
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_named_arguments
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_named_arguments_and_defaults
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_named_arguments_negative
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_nested_array
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_nested_array_input
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_nested_map
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_nested_struct
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_nondeterministic_udf
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_nondeterministic_udf2
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_nondeterministic_udf_in_aggregate
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_nonparam_udf_with_aggregate
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_num_arguments
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_raise_stop_iteration
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_register
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_type_coercion_string_to_numeric
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_and_common_filter_in_join_condition
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_as_join_condition
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_cache
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_daytime_interval
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_globals_not_overwritten
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_in_filter_on_top_of_join
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_in_filter_on_top_of_outer_join
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_in_generate
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_in_join_condition
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_in_left_outer_join_condition
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_in_subquery
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_input_serialization_valuecompare_disabled
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_kill_on_timeout
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_not_supported_in_join_condition
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_timestamp_ntz
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_256_args
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_aggregate_function
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_char_varchar_return_type
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_collated_string_types
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_column_vector
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_complex_variant_input
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_complex_variant_output
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_decorator
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_filter_function
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_input_file_name
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_logging
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_order_by_and_limit
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_pyspark_logger
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_rand
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_udt
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_variant_input
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_udf_with_variant_output
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityLegacyTests::test_use_arrow
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_arrow_udf_int_to_decimal_coercion
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_chained_udfs_with_variant
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_complex_input_types
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_complex_return_types
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_day_time_interval_in_struct
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_day_time_interval_type_casting
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_decimal_round
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_file_dsv2_with_udf_filter
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_kwargs
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_multiple_udfs_with_logging
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_named_arguments
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_named_arguments_and_defaults
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_named_arguments_negative
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_nested_array
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_nested_array_input
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_nested_map
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_nested_struct
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_nondeterministic_udf
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_nondeterministic_udf2
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_nondeterministic_udf_in_aggregate
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_nonparam_udf_with_aggregate
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_num_arguments
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_raise_stop_iteration
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_register
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_type_coercion_string_to_numeric
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_and_common_filter_in_join_condition
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_as_join_condition
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_cache
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_daytime_interval
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_globals_not_overwritten
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_in_filter_on_top_of_join
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_in_filter_on_top_of_outer_join
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_in_generate
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_in_join_condition
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_in_left_outer_join_condition
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_in_subquery
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_input_serialization_valuecompare_disabled
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_kill_on_timeout
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_not_supported_in_join_condition
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_timestamp_ntz
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_256_args
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_aggregate_function
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_char_varchar_return_type
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_collated_string_types
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_column_vector
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_complex_variant_input
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_complex_variant_output
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_decorator
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_filter_function
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_input_file_name
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_logging
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_order_by_and_limit
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_pyspark_logger
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_rand
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_udt
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_variant_input
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_udf_with_variant_output
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityNonLegacyTests::test_use_arrow
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_arrow_udf_int_to_decimal_coercion
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_chained_udfs_with_variant
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_complex_input_types
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_complex_return_types
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_day_time_interval_in_struct
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_day_time_interval_type_casting
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_decimal_round
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_file_dsv2_with_udf_filter
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_kwargs
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_multiple_udfs_with_logging
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_named_arguments
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_named_arguments_and_defaults
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_named_arguments_negative
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_nested_array
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_nested_array_input
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_nested_map
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_nested_struct
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_nondeterministic_udf
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_nondeterministic_udf2
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_nondeterministic_udf_in_aggregate
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_nonparam_udf_with_aggregate
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_num_arguments
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_raise_stop_iteration
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_register
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_type_coercion_string_to_numeric
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_and_common_filter_in_join_condition
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_as_join_condition
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_binary_type
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_binary_type_in_nested_structures
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_cache
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_daytime_interval
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_globals_not_overwritten
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_in_filter_on_top_of_join
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_in_filter_on_top_of_outer_join
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_in_generate
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_in_join_condition
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_in_left_outer_join_condition
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_in_subquery
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_input_serialization_valuecompare_disabled
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_kill_on_timeout
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_not_supported_in_join_condition
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_timestamp_ntz
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_with_256_args
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_with_aggregate_function
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_with_char_varchar_return_type
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_with_collated_string_types
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_with_column_vector
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_with_complex_variant_input
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_with_complex_variant_output
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_with_decorator
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_with_filter_function
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_with_input_file_name
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_with_logging
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_with_order_by_and_limit
pyspark/sql/tests/connect/arrow/test_parity_arrow_python_udf.py::ArrowPythonUDFParityTests::test_udf_with_pyspark_logger
pyspark/sql/tests/connect/arrow/test_

(truncated)

github-actions · 2026-02-28T05:54:33Z

Ibis Test Report

Commit Information

Commit	Revision	Branch
After	`09f814b`	`refs/pull/1442/merge`
Before	`1bb4bd6`	`refs/heads/main`

Test Summary

Suite	Commit	Failed	Passed	Skipped	Warnings	Time (s)
`test-ibis`	After	84	1507	166	4460	236.75
	Before	88	1504	166	4459	247.29

Test Details

Error Counts

(-4)       85 Total
(-3)       36 Total Unique
-------- ---- ----------------------------------------------------------------------------------------------------------
           31 UnsupportedOperationException: lambda function
            8 SparkRuntimeException: MERGE planning expects a pre-expanded logical plan (MergeIntoWriteNode). Ensure expand_merge is enabled; MERGE is currently only supported for Delta tables.
            5 IllegalArgumentException: invalid argument: found TRUNCATE at 0:8 expected something else, ';', statement, or end of input
            4 AssertionError: Series are different
            2 AnalysisException: Failed to coerce arguments to satisfy a call to 'approx_percentile_cont' function: coercion from Float64, List(Decimal128(2, 2)) to the signature OneOf([Exact([Int8, Float64]), Exac...
            2 AssertionError
            2 AssertionError: DataFrame.iloc[:, 0] (column name="result_col") are different
            2 IllegalArgumentException: invalid argument: found PARTITIONS at 5:15 expected 'DATABASES', 'SCHEMAS', 'CATALOGS', 'TABLES', 'CREATE', 'COLUMNS', 'VIEWS', or 'FUNCTIONS'
            2 assert ibis.Schema {... float64\n} == ibis.Schema {... float64\n} Full diff: ibis.Schema { carat float64 cut string color string clarity string depth float64 table float64 - price int32 ? ^^ + price i...
            1 AnalysisException: catalog not found: local
(+1)        1 AnalysisException: database not found: ibis_database_r3tcflkcjvgerjw3bdbzlupswu
            1 AnalysisException: error in SQL parser: found : at 2:3 expected '0', '1', '2', '3', '4', '5', '6', '7', '8', or '9'
            1 AssertionError: DataFrame are different
            1 AssertionError: DataFrame.iloc[:, 0] (column name="id") are different
            1 AssertionError: DataFrame.iloc[:, 0] (column name="playerID") are different
(-1)        1 AssertionError: DataFrame.iloc[:, 0] (column name="year_id") are different
            1 AssertionError: DataFrame.iloc[:, 1] (column name="collect_udf") are different
            1 AssertionError: Series NA mask are different
(+1)        1 AssertionError: assert 'ibis_cached_6kzakv565nak5jdri6wg67nho4' not in ['array_types', 'astronauts', 'awards_players', 'basic_table', 'batting', 'complicated', ...]
            1 Failed: DID NOT RAISE <class 'pyspark.errors.exceptions.base.AnalysisException'>
            1 IllegalArgumentException: invalid argument: input schema for INSERT has 1 fields, but table schema has 2 fields
            1 SparkRuntimeException: Cast error: Casting from Date32 to Float64 not supported
            1 SparkRuntimeException: Error during planning: expr type Struct("StructColumn({'x': xs, 'y': ys})": Struct("x": Int32, "y": Int32)) can't cast to Struct("x": Int64, "y": Int64) in InSubquery
            1 TypeError: Cannot convert pyarrow.lib.ChunkedArray to pyarrow.lib.Array
            1 UnsupportedOperationException: CommandNode::AlterTable
            1 UnsupportedOperationException: CommandNode::AnalyzeTable
            1 UnsupportedOperationException: Physical plan does not support logical expression AggregateFunction(AggregateFunction { func: AggregateUDF { inner: ArrayAgg { signature: Signature { type_signature: Any...
            1 UnsupportedOperationException: Physical plan does not support logical expression InSubquery(InSubquery { expr: Column(Column { relation: Some(Bare { table: "t0" }), name: "#0" }), subquery: <subquery>...
            1 UnsupportedOperationException: Physical plan does not support logical expression InSubquery(InSubquery { expr: Column(Column { relation: Some(Bare { table: "t0" }), name: "#1" }), subquery: <subquery>...
(+1)        1 UnsupportedOperationException: unknown window function: ibis_udf_mean_udf_7fa6a4a94b8
(+1)        1 UnsupportedOperationException: unknown window function: ibis_udf_mean_udf_7fa6a4aca34
(+1)        1 UnsupportedOperationException: unknown window function: ibis_udf_mean_udf_7fa6a4ad1d0
(+1)        1 UnsupportedOperationException: unknown window function: ibis_udf_mean_udf_7fa6a4f9a70
(+1)        1 UnsupportedOperationException: unknown window function: ibis_udf_quantiles_7fa6a4ce360
            1 assert frozenset({None}) == frozenset({None, 47}) Extra items in the right set: 47 Full diff: frozenset({ None, - 47, })
            1 assert {0.0, 1.0, 2.0, 3.0} == {1, 2, 3} Extra items in the left set: 0.0 Full diff: { + 0.0, - 1, + 1.0, ? ++ - 2, + 2.0, ? ++ - 3, + 3.0, ? ++ }
(-1)        0 AnalysisException: database not found: ibis_database_qtjdzhkmxjdhth7id5xilff4ta
(-1)        0 AssertionError: assert 'ibis_cached_3f2jcbjvdjabfdxq6ofstixfcq' not in ['array_types', 'astronauts', 'awards_players', 'basic_table', 'batting', 'complicated', ...]
(-1)        0 UnsupportedOperationException: cast Duration(Second) to Spark data type
(-1)        0 UnsupportedOperationException: unknown window function: ibis_udf_mean_udf_7fb424a38cc
(-1)        0 UnsupportedOperationException: unknown window function: ibis_udf_mean_udf_7fb424be738
(-1)        0 UnsupportedOperationException: unknown window function: ibis_udf_mean_udf_7fb424cf176
(-1)        0 UnsupportedOperationException: unknown window function: ibis_udf_mean_udf_7fb426060a4
(-1)        0 UnsupportedOperationException: unknown window function: ibis_udf_quantiles_7fb425f34fe
(-1)        0 assert 2 ± 2.0e-06 == 0 comparison failed Obtained: 0 Expected: 2 ± 2.0e-06
(-1)        0 assert 30.0 ± 3.0e-05 == nan comparison failed Obtained: nan Expected: 30.0 ± 3.0e-05

Passed Tests Diff

--- before.txt	2026-03-25 11:26:56.225576034 +0000
+++ after.txt	2026-03-25 11:26:56.421577040 +0000
@@ -0,0 +1,2 @@
+ibis/backends/pyspark/tests/test_aggregation.py::test_aggregation_float_nulls[count]
+ibis/backends/pyspark/tests/test_aggregation.py::test_aggregation_float_nulls[sum]
@@ -724 +725,0 @@
-ibis/backends/tests/test_generic.py::test_uncorrelated_subquery[pyspark]
@@ -1408,0 +1410 @@
+ibis/backends/tests/test_temporal.py::test_temporal_binop[pyspark-date-subtract-date]
@@ -1478,0 +1481 @@
+ibis/backends/tests/test_udf.py::test_vectorized_udf[pyspark-add_one_pandas]

Failed Tests

ibis/backends/pyspark/tests/test_basic.py::test_group_by
ibis/backends/pyspark/tests/test_client.py::test_catalog_db_args
ibis/backends/pyspark/tests/test_client.py::test_create_table_with_partition_and_catalog
ibis/backends/pyspark/tests/test_client.py::test_create_table_with_partition_no_catalog
ibis/backends/pyspark/tests/test_ddl.py::test_compute_stats
ibis/backends/pyspark/tests/test_ddl.py::test_drop_non_empty_database
ibis/backends/pyspark/tests/test_ddl.py::test_insert_table
ibis/backends/pyspark/tests/test_ddl.py::test_truncate_table
ibis/backends/tests/test_aggregation.py::test_aggregate_list_like[pyspark-list]
ibis/backends/tests/test_aggregation.py::test_aggregate_list_like[pyspark-ndarray]
ibis/backends/tests/test_aggregation.py::test_aggregate_mixed_udf[pyspark]
ibis/backends/tests/test_aggregation.py::test_approx_quantile[pyspark-True-False]
ibis/backends/tests/test_aggregation.py::test_approx_quantile[pyspark-True-True]
ibis/backends/tests/test_aggregation.py::test_date_quantile[pyspark]
ibis/backends/tests/test_aggregation.py::test_group_concat_over_window[pyspark]
ibis/backends/tests/test_array.py::test_array_agg_numeric[pyspark-no-nulls-means]
ibis/backends/tests/test_array.py::test_array_agg_numeric[pyspark-no-nulls-sums]
ibis/backends/tests/test_array.py::test_array_agg_numeric[pyspark-nulls-means]
ibis/backends/tests/test_array.py::test_array_agg_numeric[pyspark-nulls-sums]
ibis/backends/tests/test_array.py::test_array_filter[pyspark-deferred-no_nulls]
ibis/backends/tests/test_array.py::test_array_filter[pyspark-deferred-nulls]
ibis/backends/tests/test_array.py::test_array_filter[pyspark-lambda-no_nulls]
ibis/backends/tests/test_array.py::test_array_filter[pyspark-lambda-nulls]
ibis/backends/tests/test_array.py::test_array_filter[pyspark-partial-no_nulls]
ibis/backends/tests/test_array.py::test_array_filter[pyspark-partial-nulls]
ibis/backends/tests/test_array.py::test_array_filter_with_index[pyspark-lambda-no_nulls]
ibis/backends/tests/test_array.py::test_array_filter_with_index[pyspark-lambda-nulls]
ibis/backends/tests/test_array.py::test_array_filter_with_index[pyspark-partial-no_nulls]
ibis/backends/tests/test_array.py::test_array_filter_with_index[pyspark-partial-nulls]
ibis/backends/tests/test_array.py::test_array_filter_with_index_lambda[pyspark-lambda-no_nulls]
ibis/backends/tests/test_array.py::test_array_filter_with_index_lambda[pyspark-lambda-nulls]
ibis/backends/tests/test_array.py::test_array_filter_with_index_lambda[pyspark-partial-no_nulls]
ibis/backends/tests/test_array.py::test_array_filter_with_index_lambda[pyspark-partial-nulls]
ibis/backends/tests/test_array.py::test_array_map[pyspark-deferred-no_nulls]
ibis/backends/tests/test_array.py::test_array_map[pyspark-deferred-nulls]
ibis/backends/tests/test_array.py::test_array_map[pyspark-lambda-no_nulls]
ibis/backends/tests/test_array.py::test_array_map[pyspark-lambda-nulls]
ibis/backends/tests/test_array.py::test_array_map[pyspark-partial-no_nulls]
ibis/backends/tests/test_array.py::test_array_map[pyspark-partial-nulls]
ibis/backends/tests/test_array.py::test_array_map_with_conflicting_names[pyspark]
ibis/backends/tests/test_array.py::test_array_map_with_index[pyspark-lambda-no_nulls]
ibis/backends/tests/test_array.py::test_array_map_with_index[pyspark-lambda-nulls]
ibis/backends/tests/test_array.py::test_array_map_with_index[pyspark-partial-no_nulls]
ibis/backends/tests/test_array.py::test_array_map_with_index[pyspark-partial-nulls]
ibis/backends/tests/test_array.py::test_complex_array_map[pyspark]
ibis/backends/tests/test_array.py::test_table_unnest_column_expr[pyspark]
ibis/backends/tests/test_client.py::test_create_table_overwrite_temp[pyspark-no temp, overwrite]
ibis/backends/tests/test_client.py::test_insert_into_table_missing_columns[pyspark]
ibis/backends/tests/test_client.py::test_insert_overwrite_from_dataframe[pyspark]
ibis/backends/tests/test_client.py::test_insert_overwrite_from_expr[pyspark]
ibis/backends/tests/test_client.py::test_insert_overwrite_from_list[pyspark]
ibis/backends/tests/test_client.py::test_rename_table[pyspark]
ibis/backends/tests/test_client.py::test_upsert_from_dataframe[pyspark]
ibis/backends/tests/test_client.py::test_upsert_from_expr[pyspark-False]
ibis/backends/tests/test_client.py::test_upsert_from_expr[pyspark-True]
ibis/backends/tests/test_client.py::test_upsert_from_memtable[pyspark-sch0-expectation0]
ibis/backends/tests/test_client.py::test_upsert_from_memtable[pyspark-sch1-expectation1]
ibis/backends/tests/test_client.py::test_upsert_from_memtable[pyspark-sch2-expectation2]
ibis/backends/tests/test_client.py::test_upsert_from_memtable[pyspark-sch3-expectation3]
ibis/backends/tests/test_client.py::test_upsert_from_memtable[pyspark-sch4-expectation4]
ibis/backends/tests/test_export.py::test_table_to_csv[pyspark]
ibis/backends/tests/test_expr_caching.py::test_persist_expression_contextmanager[pyspark]
ibis/backends/tests/test_expr_caching.py::test_persist_expression_release[pyspark]
ibis/backends/tests/test_expr_caching.py::test_persist_expression_repeated_cache[pyspark]
ibis/backends/tests/test_generic.py::test_isin_uncorrelated[pyspark]
ibis/backends/tests/test_generic.py::test_isin_uncorrelated_simple[pyspark]
ibis/backends/tests/test_io.py::test_read_csv[pyspark-default]
ibis/backends/tests/test_io.py::test_read_csv[pyspark-file_name]
ibis/backends/tests/test_join.py::test_join_with_pandas[pyspark]
ibis/backends/tests/test_json.py::test_json_getitem_array[pyspark]
ibis/backends/tests/test_struct.py::test_field_overwrite_always_prefers_unpacked[pyspark]
ibis/backends/tests/test_struct.py::test_isin_struct[pyspark]
ibis/backends/tests/test_struct.py::test_single_field[pyspark-a]
ibis/backends/tests/test_struct.py::test_single_field[pyspark-b]
ibis/backends/tests/test_struct.py::test_single_field[pyspark-c]
ibis/backends/tests/test_temporal.py::test_delta[pyspark-time]
ibis/backends/tests/test_udf.py::test_vectorized_udf[pyspark-add_one_pyarrow]
ibis/backends/tests/test_vectorized_udf.py::test_reduction_udf_array_return_type[pyspark]
ibis/backends/tests/test_window.py::test_grouped_unbounded_window[pyspark-mean_udf]
ibis/backends/tests/test_window.py::test_ungrouped_bounded_expanding_window[pyspark-mean_udf]
ibis/backends/tests/test_window.py::test_ungrouped_unbounded_window[pyspark-ordered-mean_udf]
ibis/backends/tests/test_window.py::test_ungrouped_unbounded_window[pyspark-unordered-lag]
ibis/backends/tests/test_window.py::test_ungrouped_unbounded_window[pyspark-unordered-lead]
ibis/backends/tests/test_window.py::test_ungrouped_unbounded_window[pyspark-unordered-mean_udf]

codecov · 2026-02-28T05:54:50Z

Codecov Report

❌ Patch coverage is 55.71429% with 186 lines in your changes missing coverage. Please review.

Files with missing lines	Patch %	Lines
crates/sail-execution/src/codec.rs	33.33%	42 Missing ⚠️
...es/sail-iceberg/src/physical_plan/action_schema.rs	65.85%	14 Missing ⚠️
crates/sail-object-store/src/layers/runtime.rs	0.00%	13 Missing ⚠️
crates/sail-object-store/src/hugging_face.rs	0.00%	12 Missing ⚠️
...ail-physical-optimizer/src/join_reorder/builder.rs	0.00%	12 Missing ⚠️
crates/sail-cache/src/file_statistics_cache.rs	64.51%	11 Missing ⚠️
crates/sail-object-store/src/layers/lazy.rs	0.00%	11 Missing ⚠️
crates/sail-object-store/src/layers/logging.rs	30.76%	9 Missing ⚠️
crates/sail-cache/src/file_metadata_cache.rs	75.00%	8 Missing ⚠️
...es/sail-physical-optimizer/src/join_reorder/mod.rs	0.00%	8 Missing ⚠️
... and 19 more

@@            Coverage Diff             @@
##             main    #1442      +/-   ##
==========================================
- Coverage   75.00%   72.63%   -2.38%     
==========================================
  Files         870      870              
  Lines      114493   118301    +3808     
==========================================
+ Hits        85877    85926      +49     
- Misses      28616    32375    +3759

Flag	Coverage Δ		*Carryforward flag
ibis-tests	`19.23% <10.69%> (-0.02%)`	⬇️
python-unit-tests	`56.35% <56.91%> (+0.13%)`	⬆️
rust-slow-tests	`43.07% <ø> (+0.06%)`	⬆️	Carriedforward from 254523c
rust-unit-tests	`37.42% <28.09%> (-1.26%)`	⬇️
spark-tests	`33.13% <16.66%> (+0.03%)`	⬆️

*This pull request uses carry forward flags. Click here to find out more.

Files with missing lines	Coverage Δ
crates/sail-catalog-system/src/physical_plan.rs	`80.95% <100.00%> (ø)`
...ates/sail-data-source/src/formats/binary/source.rs	`86.91% <100.00%> (ø)`
...tes/sail-data-source/src/formats/console/writer.rs	`75.71% <100.00%> (ø)`
crates/sail-data-source/src/formats/listing.rs	`92.59% <ø> (-3.57%)`	⬇️
...sail-data-source/src/formats/python/arrow_utils.rs	`51.17% <100.00%> (ø)`
...sail-data-source/src/formats/python/commit_exec.rs	`78.54% <100.00%> (ø)`
crates/sail-data-source/src/formats/python/exec.rs	`92.02% <100.00%> (ø)`
...es/sail-data-source/src/formats/python/executor.rs	`78.29% <100.00%> (+0.25%)`	⬆️
.../sail-data-source/src/formats/python/write_exec.rs	`96.85% <100.00%> (ø)`
crates/sail-data-source/src/formats/rate/reader.rs	`83.51% <100.00%> (ø)`
... and 84 more

... and 26 files with indirect coverage changes

🚀 New features to boost your workflow:

❄️ Test Analytics: Detect flaky tests, report on failures, and find test suite problems.
📦 JS Bundle Analysis: Save yourself from yourself by tracking and limiting bundle sizes in JS merges.

linhr · 2026-02-28T05:58:49Z

@copilot Please investigate and fix the issues with Rust tests and Python tests.

…oid push_down_leaf_projections optimizer issue Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

Copilot · 2026-02-28T06:51:31Z

@copilot Please investigate and fix the issues with Rust tests and Python tests.

Investigated both Rust and Python test failures. Here's a summary of what was fixed:

Rust test failures:

test_hash_join_metrics: gold data updated for the new null_aware parameter in HashJoinExec::try_new
test_sql_function: gold data updated for PhysicalProtoConverter changes

Python test failures (including test_explode):

Root cause: The new DataFusion optimizer rule push_down_leaf_projections (new in rev 5d8249f) moves get_field expressions closer to data sources. It incorrectly pushes them through Unnest nodes — where the column _field_N still has type List(Struct(...)) (pre-unnest), not Struct(...) (post-unnest) — causing the error: Cannot access field at argument 1: type List(Struct(...)) is not Struct, Map, or Null.

Fix (commit f4a6822): In ExplodeRewriter::f_up, after list-unnesting, perform additional struct-unnesting steps to expose the struct fields as plain Column references instead of get_field expressions. Plain column references are not subject to pushdown by push_down_leaf_projections, avoiding the type mismatch. This applies to all explode variants: posexplode, posexplode_outer, inline, inline_outer, and map variants.

linhr · 2026-02-28T12:52:04Z

@copilot Please change DataFusion git revision to 73fbd48. Note that this upgrades Arrow and Parquet to 58.0.0 and object_store to 0.13.0. Please upgrade these dependencies and make code changes if needed.

…ect_store to 0.13.1, fix breaking changes Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

…for arrow 58 upgrade Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

Copilot · 2026-02-28T13:44:05Z

@copilot Please change DataFusion git revision to 73fbd48. Note that this upgrades Arrow and Parquet to 58.0.0 and object_store to 0.13.0. Please upgrade these dependencies and m...

Updated DataFusion to rev 73fbd48, arrow/parquet to 58.0.0, and object_store to 0.13.0 in commits dd37435 and f3237db.

Key changes made:

pyo3 0.28 breaking changes in sail-data-source: updated FromPyObject to two-lifetime form, replaced deprecated downcast with cast, fixed extract() error type
object_store 0.13 breaking changes: put, get, head, delete, copy, rename etc. moved from ObjectStore trait to ObjectStoreExt. Updated sail-object-store (logging.rs, runtime.rs, lazy.rs) and added ObjectStoreExt imports throughout sail-delta-lake and sail-data-source
Arrow 57↔58 incompatibility in sail-delta-lake: delta_kernel 0.18.2 internally uses arrow 57 / object_store 0.12 / parquet 57, which conflict with the workspace arrow 58 / object_store 0.13. Added an IPC-based conversion module (kernel/arrow/compat.rs) and updated error.rs to handle the version mismatch via DataFusionError::External.

Note: sail-delta-lake and sail-iceberg still have remaining compilation errors because delta_kernel 0.18.2 does not support arrow 58 or object_store 0.13. The engine_ext.rs IPC conversion needs to be completed for kernel_to_arrow and parse_stats_column, and sail-iceberg object_store fixes are pending. These require a follow-up once delta_kernel releases a version compatible with these dependency upgrades.

Warning

Firewall rules blocked me from connecting to one or more addresses (expand for details)

I tried to connect to the following addresses, but was blocked by firewall rules:

https://api.github.com/repos/apache/datafusion/commits/73fbd48
- Triggering command: /home/REDACTED/.rustup/toolchains/stable-x86_64-REDACTED-linux-gnu/bin/cargo /home/REDACTED/.rustup/toolchains/stable-x86_64-REDACTED-linux-gnu/bin/cargo fetch --locked (http block)
https://api.github.com/repos/delta-io/delta-kernel-rs/releases
- Triggering command: /usr/bin/curl curl -s REDACTED (http block)
https://api.github.com/repos/delta-io/delta-kernel-rs/tags
- Triggering command: /usr/bin/curl curl -s REDACTED (http block)

If you need me to access, download, or install something from one of these locations, you can either:

Configure Actions setup steps to set up my environment, which run before the firewall is enabled
Add the appropriate URLs or hosts to the custom allowlist in this repository's Copilot coding agent settings (admins only)

Copilot · 2026-03-10T17:17:39Z

@copilot Please continue the investigation.

Investigation complete. Here's the root cause:

Root cause: 4 MERGE tests fail with data loss when run after test_merge_explain_includes_log_scan_union_and_parallel_file_groups_then_merge_succeeds. Only rows 2 and 4 are written; NOT MATCHED BY SOURCE rows (1 and 3) are silently dropped.

Mechanism: MergeCardinalityCheckExec.required_input_distribution() returns HashPartitioned([TARGET_ROW_ID]), which causes DataFusion's physical planner to insert a RepartitionExec (N=4 partitions on this machine) before the cardinality check. The resulting projected plan (the write_input) has 4 output partitions.

In finalize_merge, projected is used twice:

insert_rows = FilterExec(path IS NULL) → projected — finds NEW inserts (source-only rows)
touched_rows = HashJoinExec(CollectLeft) → [touched_plan, projected] — finds rows from touched files

Under some execution conditions (specifically when the session has executed prior MERGEs), the NOT MATCHED BY SOURCE rows in projected do not appear in touched_rows, even though their file path is in touched_paths. The suspected cause is a subtle interaction between the hash repartition, the multi-partition projected execution, and session state from the preceding MERGE.

Candidate fix: Wrap projected with CoalescePartitionsExec in finalize_merge before it is used in the insert_rows filter and touched_rows join. This collapses all partitions to one, ensuring all rows (including NOT MATCHED BY SOURCE rows) are visible in each branch. This was not implemented before time ran out.

linhr · 2026-03-11T02:15:37Z

@copilot Please continue the investigation and implement the fix.

…loss in MERGE Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

Copilot · 2026-03-11T02:31:34Z

@copilot Please continue the investigation and implement the fix.

Fixed in commit f6e0ad0.

Root cause: MergeCardinalityCheckExec.required_input_distribution() returns HashPartitioned([target_row_id]), which causes DataFusion to insert a RepartitionExec before the cardinality check, distributing the MERGE join output across N partitions. When projected (the write_input with N partitions) was then used in both:

FilterExec(path IS NULL) → finds rows to insert (NOT MATCHED BY TARGET)
HashJoinExec(CollectLeft) → finds rows from touched files (MATCHED + NOT MATCHED BY SOURCE)

…NOT MATCHED BY SOURCE rows sharing a physical file with MATCHED rows were silently dropped under certain execution conditions (specifically after a prior MERGE had established multi-partition execution state in the session).

Fix: Added CoalescePartitionsExec to reduce projected to a single partition before using it in the targeted-rewrite filtering. This ensures all rows (including NOT MATCHED BY SOURCE rows) are visible in both the insert filter and the touched-file join paths.

linhr · 2026-03-11T06:25:04Z

@copilot Please merge from main and resolve conflicts. We now use YAML for plan snapshots, and the snapshot file location have changed. Please adjust the code accordingly.

Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

…rmat Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

Copilot · 2026-03-11T07:17:02Z

@copilot Please merge from main and resolve conflicts. We now use YAML for plan snapshots, and the snapshot file location have changed. Please adjust the code accordingly.

Merged from main in commit a2c3ee9. The merge resolved all conflicts: old per-test .plan snapshot files were replaced with per-feature YAML files in __snapshots__/features/ directories, and the pysail.testing.snapshot.yaml module (renamed from pysail.tests.snapshot_yaml) was correctly placed. Updated BDD snapshots for the DataFusion upgrade in 893b23a.

3 MERGE tests remain failing (test_rows_missing_from_the_source_are_deleted_after_updates and 2 related): a data loss bug where NOT MATCHED BY SOURCE rows (no-action, sharing a file with matched rows) are silently dropped in finalize_merge's targeted-rewrite path. Investigation confirmed this is independent of partitioning and requires deeper Rust-level debugging to resolve.

linhr · 2026-03-11T07:34:43Z

@copilot Please merge from main and resolve merge conflicts.

…sion-dependencies

Copilot · 2026-03-11T07:49:34Z

@copilot Please merge from main and resolve merge conflicts.

Merged from main in commit d4c8a08. Two add/add conflicts were resolved by accepting main's versions:

python/pysail/tests/spark/delta/__snapshots__/features/delete.yaml
python/pysail/tests/spark/delta/__snapshots__/features/merge.yaml

Build passes ✓

lonless9 · 2026-03-25T08:29:36Z

@copilot Please merge from main and resolve merge conflicts. Then bump datafusion version to 53.0.0.
Build and then run pytests to update all the snapshots, and make sure to pass all. If there are any failed tests or unstable snapshots, resolve them based on datafusion 53 related source code.

Co-authored-by: lonless9 <167735979+lonless9@users.noreply.github.com> Agent-Logs-Url: https://github.com/lakehq/sail/sessions/448d1f16-215f-4d33-8697-3063dfcede45

…sion-dependencies

github-actions · 2026-03-25T09:47:17Z

Gold Data Report

Notes

The tables below show the number of true positives (TP), true negatives (TN), false positives (FP), and false negatives (FN) in gold data input processing.
A positive input is a valid test case, while a negative input is a test case that is expected to fail.

Commit Information

Commit	Revision	Branch
After	`09f814b`	`refs/pull/1442/merge`
Before	`1bb4bd6`	`main`

Summary

Commit	TP	TN	FP	FN	Total
After	1984	197	49	390	2620
Before	1984	197	49	390	2620

Details

Gold Data Metrics

Group	File	Commit	TP	TN	FP	FN	Total
`spark`	`data_type.json`	After	48	11	2	3	64
		Before	48	11	2	3	64
	`expression/case.json`	After	5	0	0	0	5
		Before	5	0	0	0	5
	`expression/cast.json`	After	4	0	0	0	4
		Before	4	0	0	0	4
	`expression/current.json`	After	3	0	0	0	3
		Before	3	0	0	0	3
	`expression/date.json`	After	4	0	1	0	5
		Before	4	0	1	0	5
	`expression/interval.json`	After	346	4	1	0	351
		Before	346	4	1	0	351
	`expression/large.json`	After	2	0	0	0	2
		Before	2	0	0	0	2
	`expression/like.json`	After	29	10	0	0	39
		Before	29	10	0	0	39
	`expression/misc.json`	After	111	5	1	1	118
		Before	111	5	1	1	118
	`expression/numeric.json`	After	31	6	1	0	38
		Before	31	6	1	0	38
	`expression/string.json`	After	18	1	0	0	19
		Before	18	1	0	0	19
	`expression/timestamp.json`	After	7	0	3	0	10
		Before	7	0	3	0	10
	`expression/window.json`	After	73	0	1	0	74
		Before	73	0	1	0	74
	`function/agg.json`	After	148	0	0	38	186
		Before	148	0	0	38	186
	`function/array.json`	After	44	0	0	0	44
		Before	44	0	0	0	44
	`function/bitwise.json`	After	15	0	0	0	15
		Before	15	0	0	0	15
	`function/collection.json`	After	12	0	0	0	12
		Before	12	0	0	0	12
	`function/conditional.json`	After	15	0	0	0	15
		Before	15	0	0	0	15
	`function/conversion.json`	After	2	0	0	0	2
		Before	2	0	0	0	2
	`function/csv.json`	After	2	0	0	3	5
		Before	2	0	0	3	5
	`function/datetime.json`	After	160	0	0	20	180
		Before	160	0	0	20	180
	`function/generator.json`	After	7	0	0	6	13
		Before	7	0	0	6	13
	`function/hash.json`	After	5	0	0	2	7
		Before	5	0	0	2	7
	`function/json.json`	After	16	0	0	6	22
		Before	16	0	0	6	22
	`function/lambda.json`	After	1	0	0	30	31
		Before	1	0	0	30	31
	`function/map.json`	After	11	0	0	0	11
		Before	11	0	0	0	11
	`function/math.json`	After	123	0	0	1	124
		Before	123	0	0	1	124
	`function/misc.json`	After	32	0	0	42	74
		Before	32	0	0	42	74
	`function/predicate.json`	After	70	0	0	9	79
		Before	70	0	0	9	79
	`function/st.json`	After	2	0	0	5	7
		Before	2	0	0	5	7
	`function/string.json`	After	169	0	0	36	205
		Before	169	0	0	36	205
	`function/struct.json`	After	2	0	0	0	2
		Before	2	0	0	0	2
	`function/url.json`	After	10	0	0	0	10
		Before	10	0	0	0	10
	`function/variant.json`	After	0	0	0	28	28
		Before	0	0	0	28	28
	`function/window.json`	After	6	0	0	3	9
		Before	6	0	0	3	9
	`function/xml.json`	After	0	0	0	17	17
		Before	0	0	0	17	17
	`plan/ddl_alter_table.json`	After	49	14	3	11	77
		Before	49	14	3	11	77
	`plan/ddl_alter_view.json`	After	5	1	0	0	6
		Before	5	1	0	0	6
	`plan/ddl_analyze_table.json`	After	17	6	0	0	23
		Before	17	6	0	0	23
	`plan/ddl_cache.json`	After	4	0	1	0	5
		Before	4	0	1	0	5
	`plan/ddl_create_index.json`	After	0	0	0	3	3
		Before	0	0	0	3	3
	`plan/ddl_create_table.json`	After	28	29	9	39	105
		Before	28	29	9	39	105
	`plan/ddl_delete_from.json`	After	2	1	0	0	3
		Before	2	1	0	0	3
	`plan/ddl_describe.json`	After	4	0	0	0	4
		Before	4	0	0	0	4
	`plan/ddl_drop_index.json`	After	0	0	0	2	2
		Before	0	0	0	2	2
	`plan/ddl_drop_view.json`	After	5	0	0	0	5
		Before	5	0	0	0	5
	`plan/ddl_insert_into.json`	After	16	1	1	0	18
		Before	16	1	1	0	18
	`plan/ddl_insert_overwrite.json`	After	9	0	2	0	11
		Before	9	0	2	0	11
	`plan/ddl_load_data.json`	After	4	0	0	0	4
		Before	4	0	0	0	4
	`plan/ddl_merge_into.json`	After	8	4	3	0	15
		Before	8	4	3	0	15
	`plan/ddl_misc.json`	After	9	0	0	1	10
		Before	9	0	0	1	10
	`plan/ddl_replace_table.json`	After	24	13	8	39	84
		Before	24	13	8	39	84
	`plan/ddl_select.json`	After	1	0	0	0	1
		Before	1	0	0	0	1
	`plan/ddl_show_views.json`	After	7	0	0	0	7
		Before	7	0	0	0	7
	`plan/ddl_uncache.json`	After	2	0	0	0	2
		Before	2	0	0	0	2
	`plan/ddl_update.json`	After	2	1	0	0	3
		Before	2	1	0	0	3
	`plan/error_alter_table.json`	After	0	2	0	0	2
		Before	0	2	0	0	2
	`plan/error_analyze_table.json`	After	0	1	0	0	1
		Before	0	1	0	0	1
	`plan/error_create_table.json`	After	0	6	0	0	6
		Before	0	6	0	0	6
	`plan/error_describe.json`	After	0	1	0	0	1
		Before	0	1	0	0	1
	`plan/error_join.json`	After	0	2	0	0	2
		Before	0	2	0	0	2
	`plan/error_load_data.json`	After	0	1	0	0	1
		Before	0	1	0	0	1
	`plan/error_misc.json`	After	0	14	0	0	14
		Before	0	14	0	0	14
	`plan/error_order_by.json`	After	1	4	0	0	5
		Before	1	4	0	0	5
	`plan/error_select.json`	After	0	15	0	0	15
		Before	0	15	0	0	15
	`plan/error_with.json`	After	0	1	0	0	1
		Before	0	1	0	0	1
	`plan/plan_alter_view.json`	After	0	2	0	0	2
		Before	0	2	0	0	2
	`plan/plan_create_view.json`	After	0	2	0	0	2
		Before	0	2	0	0	2
	`plan/plan_explain.json`	After	0	1	1	0	2
		Before	0	1	1	0	2
	`plan/plan_group_by.json`	After	9	1	0	1	11
		Before	9	1	0	1	11
	`plan/plan_hint.json`	After	25	0	3	0	28
		Before	25	0	3	0	28
	`plan/plan_insert_into.json`	After	3	0	0	0	3
		Before	3	0	0	0	3
	`plan/plan_insert_overwrite.json`	After	2	0	0	0	2
		Before	2	0	0	0	2
	`plan/plan_join.json`	After	53	2	1	6	62
		Before	53	2	1	6	62
	`plan/plan_misc.json`	After	15	4	0	10	29
		Before	15	4	0	10	29
	`plan/plan_order_by.json`	After	15	5	1	10	31
		Before	15	5	1	10	31
	`plan/plan_select.json`	After	83	14	5	18	120
		Before	83	14	5	18	120
	`plan/plan_set_operation.json`	After	17	0	0	0	17
		Before	17	0	0	0	17
	`plan/plan_with.json`	After	6	0	1	0	7
		Before	6	0	1	0	7
	`plan/unpivot_join.json`	After	4	0	0	0	4
		Before	4	0	0	0	4
	`plan/unpivot_select.json`	After	14	6	0	0	20
		Before	14	6	0	0	20
	`table_schema.json`	After	8	6	0	0	14
		Before	8	6	0	0	14

Initial plan

f91e8d1

Copilot AI assigned Copilot and linhr Feb 28, 2026

Copilot started work on behalf of linhr February 28, 2026 03:12 View session

Copilot AI and others added 2 commits February 28, 2026 03:42

Update DataFusion dependencies to git rev 5d8249f and fix breaking ch…

53a6c62

…anges (partial) Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

Fix more DataFusion breaking changes (PhysicalExprAdapter, HashJoin, …

05f6d4c

…SimplifyContext, PartitionedFile, ScalarValue) Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

Copilot stopped work on behalf of linhr due to an error February 28, 2026 04:12
Copilot had to stop work due to a timeout.

Copilot started work on behalf of linhr February 28, 2026 04:28 View session

Fix DataFusion breaking changes: CacheAccessor, HashJoinExec, codec, …

6c5b6b2

…physical-plan properties, CoalesceBatches removal Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

Copilot AI changed the title ~~[WIP] Update DataFusion dependencies to git revision 5d8249f~~ chore: update DataFusion dependencies to git rev 5d8249f Feb 28, 2026

Copilot finished work on behalf of linhr February 28, 2026 05:20

linhr added run spark tests Trigger Spark tests on a pull request run ibis tests Trigger Ibis tests on a pull request labels Feb 28, 2026

Copilot started work on behalf of linhr February 28, 2026 05:58 View session

fix: replace get_field with struct unnesting in ExplodeRewriter to av…

f4a6822

…oid push_down_leaf_projections optimizer issue Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

Copilot finished work on behalf of linhr February 28, 2026 06:53

linhr mentioned this pull request Feb 28, 2026

Release DataFusion 53.0.0 (Feb 2026 / Mar 2026) apache/datafusion#19692

Open

26 tasks

Copilot started work on behalf of linhr February 28, 2026 12:52 View session

Copilot AI and others added 2 commits February 28, 2026 13:27

chore: update DataFusion to rev 73fbd48, arrow/parquet to 58.0.0, obj…

dd37435

…ect_store to 0.13.1, fix breaking changes Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

chore: fix delta_kernel arrow/object_store version incompatibilities …

f3237db

…for arrow 58 upgrade Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

Copilot AI changed the title ~~chore: update DataFusion dependencies to git rev 5d8249f~~ chore: update DataFusion dependencies to git rev 73fbd48 Feb 28, 2026

Copilot finished work on behalf of linhr February 28, 2026 13:46

Copilot finished work on behalf of linhr March 10, 2026 17:18

Copilot started work on behalf of linhr March 11, 2026 02:15 View session

fix: coalesce projected partitions in finalize_merge to prevent data …

f6e0ad0

…loss in MERGE Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

Copilot finished work on behalf of linhr March 11, 2026 02:32

Copilot started work on behalf of linhr March 11, 2026 06:25 View session

Copilot AI and others added 2 commits March 11, 2026 06:30

chore: merge origin/main and resolve snapshot conflicts

a2c3ee9

Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

chore: update Python BDD snapshots for DataFusion upgrade and YAML fo…

893b23a

…rmat Co-authored-by: linhr <5601366+linhr@users.noreply.github.com>

Copilot finished work on behalf of linhr March 11, 2026 07:17

Copilot started work on behalf of linhr March 11, 2026 07:34 View session

Merge remote-tracking branch 'origin/main' into copilot/update-datafu…

d4c8a08

…sion-dependencies

Copilot finished work on behalf of linhr March 11, 2026 07:50

Copilot started work on behalf of lonless9 March 25, 2026 08:29 View session

Copilot AI and others added 2 commits March 25, 2026 08:35

chore: merge from main and resolve conflicts

c2d666b

Co-authored-by: lonless9 <167735979+lonless9@users.noreply.github.com> Agent-Logs-Url: https://github.com/lakehq/sail/sessions/448d1f16-215f-4d33-8697-3063dfcede45

chore: bump DataFusion to 53.0.0, fix object_store 0.13.2 API changes

5005d31

Co-authored-by: lonless9 <167735979+lonless9@users.noreply.github.com> Agent-Logs-Url: https://github.com/lakehq/sail/sessions/448d1f16-215f-4d33-8697-3063dfcede45

Copilot AI changed the title ~~chore: update DataFusion dependencies to git rev 73fbd48~~ chore: update DataFusion dependencies to 53.0.0 Mar 25, 2026

Copilot AI requested a review from lonless9 March 25, 2026 09:28

Copilot finished work on behalf of lonless9 March 25, 2026 09:28

lonless9 added 2 commits March 25, 2026 17:40

update snapshots

e2e5914

Merge remote-tracking branch 'origin/main' into copilot/update-datafu…

254523c

…sion-dependencies

lonless9 added 2 commits March 25, 2026 18:04

attempt fix

ecea438

attempt fix

b9411ba

Conversation

Copilot AI commented Feb 28, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

github-actions bot commented Feb 28, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Spark 3.5.7 Test Report

Commit Information

Test Summary

Test Details

Uh oh!

github-actions bot commented Feb 28, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Spark 4.1.1 Test Report

Commit Information

Test Summary

Test Details

Uh oh!

github-actions bot commented Feb 28, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Ibis Test Report

Commit Information

Test Summary

Test Details

Uh oh!

codecov bot commented Feb 28, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Codecov Report

Uh oh!

linhr commented Feb 28, 2026

Uh oh!

Copilot AI commented Feb 28, 2026

Uh oh!

linhr commented Feb 28, 2026

Uh oh!

Copilot AI commented Feb 28, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

I tried to connect to the following addresses, but was blocked by firewall rules:

Uh oh!

Copilot AI commented Mar 10, 2026

Uh oh!

linhr commented Mar 11, 2026

Uh oh!

Copilot AI commented Mar 11, 2026

Uh oh!

linhr commented Mar 11, 2026

Uh oh!

Copilot AI commented Mar 11, 2026

Uh oh!

linhr commented Mar 11, 2026

Uh oh!

Copilot AI commented Mar 11, 2026

Uh oh!

lonless9 commented Mar 25, 2026

Uh oh!

github-actions bot commented Mar 25, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Gold Data Report

Commit Information

Summary

Details

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Copilot AI commented Feb 28, 2026 •

edited

Loading

github-actions bot commented Feb 28, 2026 •

edited

Loading

github-actions bot commented Feb 28, 2026 •

edited

Loading

github-actions bot commented Feb 28, 2026 •

edited

Loading

codecov bot commented Feb 28, 2026 •

edited

Loading

Copilot AI commented Feb 28, 2026 •

edited

Loading

github-actions bot commented Mar 25, 2026 •

edited

Loading