python - 在字典中定义规则后替换熊猫数据框(词频)一个词
问题描述
我有这个数据集
Word Frequency
0 : 79
1 , 60
2 cosa 26
3 e 26
4 a 25
... ... ...
526 rinviato 1
527 sconto 1
528 sui 1
529 libri 1
529 libro 1
530 casa 1
我想libri
用libro
. 我尝试如下:
my_dictionary={'libri':'libro'}
df.Word=df.Word.replace(my_dictionary)
但是当我打印 df 我没有看到任何变化
Word Frequency
0 : 79
1 , 60
2 cosa 26
3 e 26
4 a 25
... ... ...
526 rinviato 1
527 sconto 1
528 sui 1
529 libri 1
529 libro 1
530 casa 1
你知道原因吗?
代码:
df = pd.DataFrame(word_dist.most_common(1000),
columns=['Word', 'Frequency'])
df.Word = df['Word'].replace(my_dictionary, regex=True)
其中 my_dictionary 定义如下:my_dictionary={'libri': 'libro', 'sui':'suo'}
等等
解决方案
使用正则表达式=真:
my_dictionary={'libri':'libro'}
df.Word= df['Word'].replace(my_dictionary, regex=True)
推荐阅读
- delphi - 如何在 Android 应用程序中使用 Delphi 中的 OpenDialog
- android - 将值从应用程序传递到另一个应用程序
- java - 按下按钮时,应在日期选择器上显示并计数一个数字
- maximo-anywhere - Maximo Anywhere 自定义应用程序不会缓存下载到设备的所有记录
- haskell - 如何在 Haskell 中进行类型反射
- angular - 使用带有动态 src 属性的 google 嵌入地图
- java - 有没有办法在spring boot的main方法中调用@Scheduled注解
- android - Xamarin WebView 上的相机
- javascript - 如何通过javascript验证输入(type =“file”)仅用于上传图像?
- sql - Postgresql ADD SERIAL COLUMN IF NOT EXISTS 仍在创建序列