python - 高效的应用功能在数据帧上实现
问题描述
我已经创建了数据框中所有评论的极性分数。我正在为此使用 vader 库。我正在使用应用于数据帧的 lamda 函数来创建极性分数。我的数据框很大,代码花费了太多时间。我也尝试过编写函数并应用它,但仍然太耗时。帮助我提高代码效率。
我曾尝试将 lambda 函数与 apply 一起使用,我已经编写了一个函数循环,通过它应用于每一行。没有任何效果。
start= time.time()
df =data_temp['reviews_list'].apply(lambda x :pd.DataFrame(analyser.polarity_scores(x),index=[0]))
end = time.time()
print(end-start)
对于最初的 100 条记录,它需要 29 秒。我需要一个快速的解决方案也试过
def func(x):
return(analyser.polarity_scores(x))
df =data_temp['reviews_list'].apply(lambda x :pd.DataFrame(func(x),index=[0]))
输出应采用数据帧的形式,稍后我可以将其连接到原始数据帧
解决方案
推荐阅读
- python - 已安装 Python 模块,可以在终端中运行,但不能在文件中运行
- multithreading - 通过期货线程限制触发并发任务?
- scala - 如何对scala中的数据框列进行操作
- node.js - Azure 函数 Sendgrid 附件损坏
- php - 如何使用 codeigniter 更新记录?
- c# - 在c#中读取rabbitmq队列中消息的最佳方法
- python - 在 Flask 应用程序中的模块之间共享对象
- docusignapi - Docusign - 添加补充文件
- html - 弹性堆叠柱
- hazelcast - Hazelcast 是否支持同步(sync)@Cacheable 实现