Databricks Certified Machine Learning - Associate

Get started today

Ultimate access to all questions.

Explanation:

To convert a PySpark DataFrame to a Pandas on Spark DataFrame, you can use the 'toPandasAPI()' method, which is provided by the Pandas API on Spark. The correct code snippet would be 'pandas_df = spark_df.toPandasAPI()'. After converting the DataFrame, you can perform a groupby operation on the 'category' column using the 'groupby()' method, as shown in option C.

Explanation:

Comments (0)

No comments yet.

Given a PySpark DataFrame named 'spark_df', write a code snippet that converts it to a Pandas on Spark DataFrame and then performs a groupby operation on a column named 'category'.

Simulated

Last updated: May 25, 2026 at 14:02

pandas_df = spark_df.toPandas() grouped = pandas_df.groupby('category')

26.2%

pandas_df = spark_df.toPandas().groupby('category')

18.0%

pandas_df = spark_df.toPandasAPI() grouped = pandas_df.groupby('category')

39.3%

pandas_df = spark_df.select('category').toPandas() grouped = pandas_df.groupby('category')

16.4%