python - 使用字典替换DataFrame中句子中的单词
问题描述
我正在尝试用字典替换数据框中句子中的单词。如何替换原始数据框?
字典:rep_vocab 包含{wrong words: correct words}
数据框:data_test 列 ['question1'] 句子列 ['d5'] 包含一组在句子中拼写错误的单词。我使用此列快速定位有错误单词的句子行。
我的代码:
data_test.loc[data_test['d5']!=set()['question1'].replace(rep_vocab,regex=True)
它返回正确的结果,但数据框中的原始值不会改变。我尝试了其他方法,例如 use inplace=True
,但它引发了警告:
试图在 DataFrame 中的切片副本上设置一个值。尝试改用 .loc[row_indexer,col_indexer] = value
解决方案
您可以只获取输出并将其插入(因此不要就地执行)。
data_test.loc[data_test['d5']!=set()['question1'] = data_test.loc[data_test['d5']!=set()['question1'].replace(rep_vocab,regex=True)
但请检查您是否需要条件,您可能只需键入:
data_test['question1'] = data_test['question1'].replace(rep_vocab,regex=True)
推荐阅读
- javascript - Jest ioredis mock - 将模拟绑定到模块
- c - waitpid() 总是返回 '-1'
- database - 我无法在 Apache NetBeans 12.3 上创建数据库
- python - Python 红黑树中的 TNULL
- flutter - 获取信息以在颤动中详细显示页面的最佳方法是什么?
- reactjs - 如何从内容原始数据中获取 RSS 提要的 html 元素(gatsby-plugin-feed)
- airflow - Airflow Pentaho 插件 - DAG 的状态总是成功
- javascript - 使用 .p12 证书和密码连接到 Elasticsearch
- java - 在我的 JPanel 屏幕上缩小 JLabel 和 JText
- typescript - useAnimatedGestureHandler onStart 方法正确的上下文参数类型