python - 有哪些选项可以为 AWS 上的 Pandas 设置自动报告流程?
问题描述
我目前正在使用弹性 beantalk 和 apscheduler 每天自动运行 Pandas 报告。数据集越来越大,我已经将内存大小增加了 3 倍。
Elastic Beanstalk 正在运行 Dash - 仪表板应用程序,并且每晚运行一次自动化 Pandas 报告。
我尝试设置 AWS Lambda 以在那里运行 Pandas 报告,但我不知道如何使用它。
我正在寻找一种最经济有效的方式来运行我的报告,而不必增加 Beanstalk 上的内存使用量。当我在本地运行它需要 1gb 但在 beanstalk 上运行它时,它使用超过 16gb。
好奇其他人是否有更好的选择或处理他们如何自动运行 Pandas 报告。
解决方案
在计算机上的任务计划程序上使用 Pyinstaller Schedule .exe 创建一个 .exe
至少在我的情况下,比扩展 AWS Beanstalk 资源更便宜,因为 AWS Beanstalk 使用比本地计算机更多的资源来计算熊猫。
推荐阅读
- r - 使用 lubridate 计算两个日期之间的天数差异
- android - 有什么方法可以在 Flutter 的 Google Chrome 中启动 URL?
- c# - Blazor SignInManager PasswordSignIn() 方法抛出 InvalidOperationException
- python - 对于同一个问题,R & Python 显示了两个不同的结果。背后的原因是什么?
- python - 解析时区并转换为夏令时
- .net - 我的应用程序部署到 Cloud Foundry 失败
- elisp - Elisp:带有 &body 和 &rest 的 defmacro 表现不同?
- mysql - Mysql with node 并表示奇怪的查询错误
- javascript - 在上传替换最后一个图像问题之前上传和预览文件
- python - 如何为给定的可迭代对象创建流生成器?