我们最近开始工作Databricks和我一直试图找到一种方式执行合并声明,在三角洲的表格,虽然使用R api(最好sparklyr). 最终的目的是以某种方式强加一个'重复'约束所描述的 在这里. 上述文件描述了蟒蛇的工作流程:
deltaTable.alias("logs").merge(
newDedupedLogs.alias("newDedupedLogs"),
"logs.uniqueId = newDedupedLogs.uniqueId") \
.whenNotMatchedInsertAll() \
.execute()
但是,我想知道是否有直接的方式来实现这一过R.任何援助/想法,对该问题将非常感激,因为我是一个新的用户(如上所述). 在此先感谢!