首页 > 解决方案 > 如何更快地编译我的拼写检查脚本?我当前的脚本花费了太多时间

问题描述

我有一个数据集,其中有 154,051 行和 13 列。其中一列有文本。我想找出经常出现的单词。我想确保拼写正确。所以我运行了以下脚本,但它花费了太多时间并且它仍在运行。有没有办法让我跑得更快?

import pandas as pd
from spellchecker import SpellChecker

df = pd.read_excel('D:\Text\Text.xlsx')
df = df.astype({"SEARCH_TEXT": str})

mispelled = " ".join(df["SEARCH_TEXT"]).split()

spell = SpellChecker()
eng=[]
for i in mispelled:
    i=spell.correction(i)
    eng.append(i)

有人可以告诉我更快的执行方式吗?

标签: pythonpandasdataframespell-checking

解决方案


推荐阅读