首页 > 解决方案 > AWS lambda 中的 Cloudwatch 指标参数

问题描述

我正在尝试了解 aws lambda 的 cloudwatch 指标。为了解决与迭代器年龄相关的问题,我们可能需要调查以下参数。

  1. 记忆问题
  2. 没有足够的运动碎片
  3. 调用错误
  4. 批量大小不足

其中,内存问题可以从cloudwatch洞察力看出?但是我们如何确定问题是由于其他参数引起的呢?说我如何识别迭代器年龄增加以及由于没有足够的分片,或者由于批量大小或由于调用错误。有没有日志可以知道这些?请帮忙

标签: amazon-web-servicesaws-lambdaamazon-kinesis

解决方案


这些选项中的每一个都需要不同的指标和日志。

  1. 检查我的 lambda 是否失败 - 您可以检查 lambda 指标选项卡以查看是否出现错误(lambda 完成但没有成功),在这种情况下,来自分片的所有失败记录都返回到分片进行重试。

  2. 更高级的问题可能是具有导致迭代器年龄增长的特定分片,在这种情况下,您可能需要在 kinesis 配置下启用分片指标(增强 [shard-level] 指标)以查找可能导致问题。

在这两种情况下,请检查 CloudWatch 下的 lambda 日志和指标,以了解您是否有错误或超时。

  1. 您处理数据的速度可能比推入慢,比较获取记录 - 总和(计数)与传入数据 - 总和(计数)在 cloudwatch 中的 kinesis 指标下,如果您处理数据的速度不够快,添加更多分片会有所帮助(更多 lambda处理数据的实例)

作为免责声明,我在为无服务器应用程序提供监控和调试解决方案的Lumigo工作。因此我们可以轻松解决您的 lambda 问题,我们将让您全面了解调用错误和内存问题,无需再在日志中搜索 :-)


推荐阅读