Databricks Certified Data Engineer - Professional

Ultimate access to all questions.

When optimizing Spark SQL window functions over a large dataset, which technique significantly enhances performance?

Real Exam

Increasing spark.sql.shuffle.partitions to a very high number to ensure data is evenly distributed.

11.5%

Partitioning the DataFrame by the window’s partitionBy column before applying the window function.

65.5%

Loading comments...