python - 如何将结果从一个变量转移到excel中的一列?
问题描述
我想将里面的值添加duplicates
到列Name
中,以便print(data["Name"])
可以返回duplicates
. 我怎样才能做到这一点?
小故事:我正在导入一个 csv 文件,我需要拆分列Name
以删除无意义的信息,然后我使用列表理解来查找重复项。
data = pd.read_csv(next(iglob('*.csv')))
data["Name"]= data["Name"].str.split("(", n = 1, expand = True)
duplicates = [x for x in data["Name"] if x in data["Name"]
[data["Name"].duplicated()].values]
解决方案
编辑:
df['dupicates'] = df['Name'].where(df['Name'].duplicated(keep=False), '')
Name duplicates
0 NameC
1 NameA NameA
2 NameB NameB
3 NameA NameA
4 NameA NameA
5 NameB NameB
或者,如果您只想标记那些重复值...(删除keep=False
)
df['duplicates'] = df['Name'].where(df['Name'].duplicated(), '')
Name duplicates
0 NameC
1 NameA
2 NameB
3 NameA NameA
4 NameA NameA
5 NameB NameB
IIUC,你可以尝试这样的事情:
df = pd.DataFrame({'Name':['NameC', 'NameA', 'NameB', 'NameA', 'NameA', 'NameB']})
duplicates = df.loc[df['Name'].duplicated(), 'Name'].unique().tolist()
duplicates
输出:
['NameA', 'NameB']
说明:duplicates
用于创建一个布尔系列,然后通过布尔系列和“名称”列过滤数据框,然后使用 unique 获取所有重复项的唯一值。
推荐阅读
- jquery - 如何将 jQuery 函数与另一个 ajax 函数结合起来?
- scala - 如何获得在scala中添加两对的总和?
- python - 来自 aio_pika 的强大连接未重新连接
- buildroot - 使用 buildroot 和 uboot 在引导期间扩展 TPM2.0 的 PCR
- sql-server - 使用 FreeText 进行全文搜索,但只返回包含表达式的所有单词的记录,除了停用词列表中的那些
- angular - Angular 8材料设计仅在服务器重启后
- reactjs - 使用 react usestate hook 防止重新渲染每个 setstate
- string - 为什么有不同的 STRING 格式?
- angular - 在前端 Angular 应用程序上访问 gmail API
- angular - 在孙子组件和父组件之间传递值