pyspark - 在pyspark中,Alteryx右外自连接等于什么?
问题描述
试过:
df_new = df_1.join(df_2,[df_1['ph_id_1'] == df_2['ph_id_2']],how='left_anti')
, 和
df_new = df_1.filter(df_1['ph_id_1'] != df_2['ph_id_2'])
两者都给出相同的结果,与实际结果不同。
试过:
df_new = df_1.join(df_2,[df_1['ph_id_1'] == df_2['ph_id_2']],how='left_anti')
, 和
df_new = df_1.filter(df_1['ph_id_1'] != df_2['ph_id_2'])
两者都给出相同的结果,与实际结果不同。
标签: pysparkdatabricksalteryx