Reddit

A data engineer is utilizing a foreachBatch logic to upsert data into a target Delta table. The function to be invoked at each new microbatch processing is shown below with a blank:

def upsert_data(microBatchDF, batch_id):
    microBatchDF.createOrReplaceTempView("sales_microbatch")
    sql_query = """
    MERGE INTO sales_silver a
    USING sales_microbatch b
    ON a.item_id=b.item_id
    AND a.item_timestamp=b.item_timestamp
    WHEN NOT MATCHED THEN INSERT *
    """
    ________________

def upsert_data(microBatchDF, batch_id):
    microBatchDF.createOrReplaceTempView("sales_microbatch")
    sql_query = """
    MERGE INTO sales_silver a
    USING sales_microbatch b
    ON a.item_id=b.item_id
    AND a.item_timestamp=b.item_timestamp
    WHEN NOT MATCHED THEN INSERT *
    """
    ________________

Which option correctly fills in the blank to execute the SQL query in the function on a cluster with Databricks Runtime below 10.5?*

Real Exam

spark.sql(sql_query)_

13.2%

batch_id.sql(sql_query)

5.1%

microBatchDF.sql(sql_query)_

12.8%

microBatchDF.sparkSession.sql(sql_query)_

30.8%

microBatchDF._jdf.sparkSession().sql(sql_query)

38.1%

Databricks Certified Data Engineer - Professional

Comments

Get started today