python - 使用 CFLAGS 和 PIP 缩小 AWS Lambda 部署包以适应 sklearn
问题描述
我正在用我的 Lambda 处理程序加载一个腌制机器学习模型,所以我需要 sklearn(如果不包括,我会得到“ModuleNotFoundError:没有名为'sklearn'的模块”)
所以我用 sklearn 在 Docker 中创建了一个新的部署包。
但是当我尝试上传新的 lambda.zip 文件时,我无法保存 lambda 函数。我收到错误:解压缩后的大小必须小于 262144000 字节
我做了一些谷歌搜索,发现了两个建议:(1)使用 CLFAG 和 PIP和(2)使用 Lambda 层。
我认为图层不会起作用。将我的部署包的一部分移动到层不会减少总大小(AWS 文档指出“函数的总解压缩大小和所有层不能超过解压缩的部署包大小限制 250 MB”。
CFLAGS 听起来很有希望,但我以前从未使用过 CFLAGS,而且我遇到了错误。
我正在尝试添加标志:-Os -g0 -Wl,--strip-all
在 CLFAGS 之前,我的 docker pip 命令是:pip3 install requests pandas s3fs datetime bs4 sklearn -t ./
首先我试过:pip3 install requests pandas s3fs datetime bs4 sklearn -t -Os -g0 -Wl,--strip-all ./
这产生了各种错误“没有这样的选项:-g”
然后我尝试CFLAGS = -Os -g0 -Wl,--strip-all pip3 install requests pandas s3fs datetime bs4 sklearn -t ./
了CFLAGS = -Os -g0 -Wl,--strip-all
但是他们产生了错误“CFLAGS:找不到命令”
谁能帮我理解如何使用 CFLAGS?
另外,我很熟悉“乞丐不能选择”这句话,所以任何建议都将不胜感激。
也就是说,我有点菜鸟,所以如果你能在我的 Docker 部署包工作流程的上下文中帮助我使用 CFLAGS,将不胜感激。
我的码头工人工作流程是:
- docker run -it olivierhervieu/amazonlinux-python36-onbuild
- mkdir 部署
- cd部署
- pip3 install requests pandas s3fs datetime bs4 sklearn -t ./
- zip -r lambda.zip *
解决方案
这有点像是一个答案(我能够缩小我的部署包并部署我的 Lambda)并且有点不是一个答案(我仍然不知道如何使用 CFLAGS)。
大量的谷歌搜索最终让我找到了这篇文章,其中包含一个链接到这个预先安装在 AWS Lambda Python 环境中 的模块列表。
我的部署包包含几个已经存在于 AWS Lambda 环境中的模块,因此不需要包含在部署包中。
为我节省最多空间的模块是 Boto3 和 Botocore。我没有在我的 Docker 环境中明确添加这些,但它们还是进入了我的部署包(我猜 S3FS 依赖于这些模块,并且在安装 S3FS 时它们也被添加)。
我还能够删除许多较小的模块(datetime、dateutil、docutils、6 等)。删除这些模块后,我的包低于 250mb 限制,我能够部署。
如果我仍然没有达到限制 - 我不确定这是否足够 - 我将尝试上面链接文章中的另一个建议:从部署包中删除 .py 文件(你不需要 .pyc 和.py 文件)。
希望这对您的 Lambda 部署包大小有所帮助!
推荐阅读
- jenkins - 我如何在 Jenkins 管道中使用管道脚本文件(管道选项卡)
- r - 在 R 中使用 for 循环
- python - 按 ID 对 pandas 行进行分组,为时间条目创建新列
- java - 在条件评估期间是否可以获取 bean 名称?
- python - SSL: CERTIFICATE_VERIFY_FAILED] 证书验证失败:无法获取本地颁发者证书 (_ssl.c:1076)
- angular - 如何使用打字稿客户端(Signalr Core)将标头传递给信号器集线器
- html - 电子邮件签名模板中使用的奇怪 CSS 类
- sql - 如何计算 Postgresql 中的 jsonb 对象键?
- regex - 如何使 Google Sheets REEXTRACT RegEx 函数进行“贪婪”模式匹配
- javascript - AngularJS HTTP 使用响应