python - 在数据框中保持最佳条目
问题描述
假设我有以下数据框:
DeedNo Partner1 Partner2
0 4 Ysolda Calcerani
2 4 Calcerani
3 4 Ysolda
4 4 Calcerano Ysolda
5 4 Calceranus Ysolde
6 10 Catherina
7 10 Lencium
8 10 Lencij
9 18 Catherina Frankynj
10 18 Frankyni Vassaldo
有没有办法保持每个契约的最佳条目,即:对于契约 4,最佳条目可以是 (Ysolda, Calcerani)、(Calcerano, Ysolda) 或 (Calceranus, Ysolde)
契约 10 (Catherina) 和 (Lencium or Lenciy) 是最好的,而契约 18 (Catherina, Frankynj) 是最好的。
我正在尝试从文本中获得已婚夫妇,但正如您所看到的,有名称变体,有时尽管存在关系的关键字,但有时可能只获得一个合作伙伴。谢谢