python - python for loop - 大数据集的运行时优化
问题描述
我有一些逻辑可以检查特定行的 id 是否出现在同一行的同一数据框的另一列中。如果 id 出现在 df['list_of_approved_id'] 中,那么我将字段 df['flag'] 的值更改为 1。
df['flag'] = 0
for ind in df.index:
if df['id'][ind] in (df['list_of_approved_id'][ind]):
df['flag'][ind] = 1
逻辑过去运行良好,但现在慢得多。我正在尝试将这个逻辑重写为运行得更快的更 Python 的东西。寻求帮助以优化此逻辑!任何帮助表示赞赏!
解决方案
推荐阅读
- java - windows唤醒后如何唤醒Java计时器?
- android - 前台通知服务有时会自行停止,有时会在牛轧糖中自动启动
- angular - Angular Materials Modal:为什么我的变量在订阅中未定义但在地图方法中未定义?
- android - 无文本预览的 NumberPad 键盘
- eclipse - 当我运行我的项目时,这个运行时错误是什么?
- testing - 我如何安装 Spectron 并开始编写脚本?
- maven - 没有 settings.xml 的声纳 Maven 插件
- facebook - 如何在 facebook 分析服务器到服务器中处理用户
- javascript - 如何将 jQuery UI 所有选定范围(不仅是最小值和最大值)加载到数组中
- azure - Hive Table 迁移到不同的环境