python - 创建单词列表并按索引分组
问题描述
我有索引列,每个索引都有对应的单词:
ID | 单词 |
---|---|
1 | 单词1 |
1 | 字2 |
1 | 词3 |
2 | 字4 |
2 | 单词5 |
等等。
我想以这种方式按索引对它们进行分组: for id 1-[word1,word2,word3] for id 2-[word4,word5]
等等
并提取到 CSV 文件
我有这个代码:
df = pd.DataFrame(data)
d={"word":"first"}
df_new = df.groupby(df['id'], as_index=False).aggregate(d).reindex(columns=df['word'])
print (df_new)
df_new.to_csv('test.csv', sep='\t', encoding='utf-8', index=False)
我需要改变什么才能让它工作?
先感谢您
解决方案
# Import Dependencies
import pandas as pd
# Create DataFrame
data = {'id': [1, 1, 1, 2, 2], 'word': ['word1', 'word2', 'word3', 'word4', 'word5']}
df = pd.DataFrame(data)
# Groupby and Merge
df = df.groupby('id', as_index=False).agg({'word' : ','.join})
# Result
id word
0 1 word1,word2,word3
1 2 word4,word5
推荐阅读
- go - gob:类型不匹配:没有匹配的字段编译解码器 - Golang
- loops - 如何在 VBA Excel 中集体搜索范围内的两个值
- r - .jfindClass(as.character(driverClass)[1])中的R错误:java.lang.ClassNotFoundException
- javascript - Rails 5 Bootstrap 4 Simple_Form 文件上传前的图像预览
- javascript - 如何创建具有下一个 ID 号的行
- c++ - 当提供第二个时,首先删除哪个 shared_ptr/object?
- java - 如何让服务层在从数据库中获取任何内容时返回 Mono::error
- javascript - Tone.JS - 加法合成器
- ios - Swift - 在表格视图上打印数组降序
- python-3.x - 通过python在文本文件中查找重复值