python - 如何从两个用户之间的连接表中检索一组连接的用户?在 Python 中
问题描述
该表由连接在一起的成对用户组成。下面是一个假设的例子:
用户1,用户2
a, b a, c e, a c, e d, e a, e j, e j, d f, e j, f f, d
我如何制作集群或字典,说明哪些用户夫妇或二人组有其他用户二人组的共同点:(想要的假设结果是:)
c1:a、b c2:a、c、e c3:d、e、f、j
有谁知道如何形成查询语句或创建算法来检索 Python 中的连接集群?
谢谢!
解决方案
下面的代码是我现在所拥有的示例,这里的问题是,所有的情侣都出现了,这些情侣也出现在三重奏或四重奏中,这是不对的
lijst = []
verzameling = set()
for index, row in df.iterrows():
if verzameling == set():
verzameling.add(row['city1'])
verzameling.add(row['city2'])
else:
if row['city1'] in verzameling or row['city2'] in verzameling:
verzameling.add(row['city1'])
verzameling.add(row['city2'])
else:
lijst.append(verzameling)
verzameling = {row['city1']}
verzameling.add(row['city2'])
print(lijst)
下图是文件现在外观的示例,它是一个 csv 文件,我在 python 中作为数据框加载在 此处输入图像描述 我想对所有城市进行分组,以便该组中的每个城市都有其他共同的城市
推荐阅读
- openstreetmap - 试图从司机当前位置检索道路限速
- javascript - 测试一些基本 javascript 代码时出现意外输出
- java - 使用 indexOf 方法从 arraylist 获取字符串,但它被认为是整数
- vb.net - 显示行显示索引超出范围
- html - 如何用颜色三角形和一些文本覆盖 html 输入?
- git - “HEAD -> 分支,起源/分支”在 git 提交日志中是什么意思?
- c++ - 按字母顺序排序数组c ++
- sql-server - 如何从 varchar(max) 中的 DD/mm/yyyy 转换为 SQL Server 中的 yyyymmdd 格式
- javascript - 找到带有旋转轴的旋转多边形的边界框
- javascript - Web 项目在 Visual Studio 实时服务器中无法正常运行