python - 如何创建关联表?
问题描述
我有一个 excel 文件,在一列中,我有症状。
我的工作是创建一个新的 Excel 文件,其中每个症状都相互交叉,这样我就可以计算每个关联的支持、信心和提升。
原始的 excel 文件有超过 1500 种不同的症状。所以联想excel会很大。
有谁现在我应该怎么做?
我想要一张桌子:
症状 1 - 症状 2
症状 2 - 症状 3
症状 1 - 症状 3
解决方案
要创建具有所有其他症状的另一列,请使用:
df = pd.read_excel(my_file)
df['key'] = 1
df = df.merge(df.rename({'sympthom': 'symptom2'}, axis=1), how='outer').drop('key',
axis=1)
df = df[df['symptom'] < df['symptom2']] # to remove duplicates
df.to_excel('new_file.xlsx', index=False)
现在在“new_file”中,您将有两列包含所有症状匹配
推荐阅读
- python-3.x - python中的object.attribute语法是否算作名称?
- sas - 函数 LAG 中的动态 n
(变量)SAS_part2 - python - subprocess.Popen 不断询问 ssh-copy-id 命令的密码
- c# - 从 Asp.Net Core 2.1 Web 应用程序的 SQL 迁移中的 Db 更新中的 NOT 关键字错误
- javascript - 得到错误 SyntaxError: expected expression, got '}' in Firefox
- java - Apache tomcat 和 servlet(初学者) - 404 错误,可能找不到类?
- elasticsearch - 如何进行正确的查询以按 ID 选择,然后使用弹性搜索进行更新?
- azure-functions - 如何在本地运行 Azure 函数时获取日志?
- node.js - 需要从数组productid[]中删除元素,该元素是mongodb集合用户的一个元素
- hugo - Hugo 为内容部分生成 URL。我该如何阻止它?