首页 > 解决方案 > 高效的应用功能在数据帧上实现

问题描述

我已经创建了数据框中所有评论的极性分数。我正在为此使用 vader 库。我正在使用应用于数据帧的 lamda 函数来创建极性分数。我的数据框很大,代码花费了太多时间。我也尝试过编写函数并应用它,但仍然太耗时。帮助我提高代码效率。

我曾尝试将 lambda 函数与 apply 一起使用,我已经编写了一个函数循环,通过它应用于每一行。没有任何效果。

start= time.time()
df =data_temp['reviews_list'].apply(lambda x :pd.DataFrame(analyser.polarity_scores(x),index=[0]))
end = time.time()
print(end-start)

对于最初的 100 条记录,它需要 29 秒。我需要一个快速的解决方案也试过

def func(x):
    return(analyser.polarity_scores(x))
df =data_temp['reviews_list'].apply(lambda x :pd.DataFrame(func(x),index=[0]))

输出应采用数据帧的形式,稍后我可以将其连接到原始数据帧

标签: pythonpandas

解决方案


推荐阅读