首页 > 解决方案 > 替换印尼语中的缩写词或俚语

问题描述

我在excel文件原始数据中有很多这样的文本 数据

以及来自 txt 文件 俚语/缩写词的印度尼西亚俚语或缩写词的字典列表

如何根据我之前制作的字典替换文本中的单词?

标签: pythonabbreviation

解决方案


您可以这样做(这是一个字符串的示例):

string = 'asd des sdss d'
replacements = {"asd": "replaced"}
new_string = " ".join(replacements.get(word, word) for word in string.split(' '))
print(new_string)

result: 'replaced des sdss d'

这不会处理文本中的特殊字符,例如','or '.'。也许您需要添加逻辑来处理这些事情。


推荐阅读