首页 > 解决方案 > 如何在 Python 中通过名义/有序变量对文本字符串进行分组?

问题描述

我已经使用 snscrape 和 pandas 抓取了一个人的整个推文历史,现在有一个具有以下一般格式的数据框:

Index | Year | Month | Tweet     | Username
01    | 2011 | 02    | String1   | JoESchmoe
02    | 2011 | 03    | String2   | JoESchmoe
03    | 2012 | 01    | String3   | JoESchmoe
04    | 2012 | 04    | String4   | JoESchmoe

我想要做的是根据我不同的日期变量将所有字符串连接在一起。理想情况下,我希望能够获得这样的数据框:

Index | Year | Tweet           | Username
01    | 2011 | String1.String2 | JoESchmoe
02    | 2012 | String3.String4 | JoESchmoe

根据我到目前为止所读到的内容,似乎 groupby 是执行此操作的合适功能,但如果有另一种方式,我很想听听!

在此先感谢您的时间!

标签: pythonpandasstringconcatenationpandas-groupby

解决方案


推荐阅读