Databricks Certified Data Engineer - Professional

Get started today

Ultimate access to all questions.

Quick Answer

Answer-first summary for fast verification

Answer: spark.sql.files.maxPartitionBytes

The correct answer is A. The configuration parameter `spark.sql.files.maxPartitionBytes` directly determines the maximum size (in bytes) of a single partition when reading data from files. This setting controls how Spark splits input files into partitions during ingestion. Options B, C, and D are unrelated to initial partition sizing: B governs broadcast joins, C provides advisory sizes for adaptive query execution (AQE) during shuffles, and D sets the minimum partitions during AQE coalescing. Only A directly impacts partition size at ingestion.

Author: LeetQuiz Editorial Team

Quick Answer

Answer-first summary for fast verification

Answer: spark.sql.files.maxPartitionBytes

Author: LeetQuiz Editorial Team

Comments (0)

No comments yet.

Which configuration parameter directly controls the size of a Spark partition during data ingestion?

Exam-Like

spark.sql.files.maxPartitionBytes

80.4%

spark.sql.autoBroadcastJoinThreshold

3.9%

spark.sql.adaptive.advisoryPartitionSizeInBytes

7.8%

spark.sql.adaptive.coalescePartitions.minPartitionNum

7.8%