首页 > 解决方案 > 在字典中定义规则后替换熊猫数据框(词频)一个词

问题描述

我有这个数据集

Word    Frequency
0   :   79
1   ,   60
2   cosa    26
3   e   26
4   a   25
... ... ...
526 rinviato    1
527 sconto  1
528 sui 1
529 libri   1
529 libro   1
530 casa    1

我想librilibro. 我尝试如下:

my_dictionary={'libri':'libro'}
df.Word=df.Word.replace(my_dictionary)

但是当我打印 df 我没有看到任何变化

   Word Frequency
    0   :   79
    1   ,   60
    2   cosa    26
    3   e   26
    4   a   25
    ... ... ...
    526 rinviato    1
    527 sconto  1
    528 sui 1
    529 libri   1
    529 libro   1
    530 casa    1

你知道原因吗?

代码:

df = pd.DataFrame(word_dist.most_common(1000),
                    columns=['Word', 'Frequency'])


df.Word = df['Word'].replace(my_dictionary, regex=True)

其中 my_dictionary 定义如下:my_dictionary={'libri': 'libro', 'sui':'suo'}等等

标签: pythonpandas

解决方案


使用正则表达式=真:

my_dictionary={'libri':'libro'}
df.Word= df['Word'].replace(my_dictionary, regex=True)

推荐阅读