首页 > 解决方案 > Lambda + Sequelize 随机获取 SequelizeConnectionError ETIMEDOUT

问题描述

我们在 Aws Lambda 中使用 Sequelize,并且在大多数情况下一切正常,但随机出现以下错误:

ETIMEDOUT {"name":"SequelizeConnectionError","parent":{"errorno":"ETIMEDOUT","code":"ETIMEDOUT","syscall":"connect","fatal":true},"original":{"errorno":"ETIMEDOUT","code":"ETIMEDOUT","syscall":"connect","fatal":true}}

我们正在使用 Rds - mysql 8.0.15、Serverless 框架、serverless-http、serverless-webpack。这是我们的文件配置。

//db.js

... import all models

const sequelize = new Sequelize(
  process.env.DATABASE,
  process.env.DB_USER,
  process.env.DB_PASSWORD,
  {
    host: process.env.DB_HOST,
    port: process.env.STAGE === "dev" ? 3306 : 31304,
    dialect: "mysql",
    dialectOptions: { decimalNumbers: true },
    pool: {
      max: 10,
      min: 0
    }
  }
);

const models = {};

// Initialize models
modules.forEach(module => ...

export default models;
//handler.js

import express from "express";
import serverless from "serverless-http";
import db from "./db";

const app = express();

app.use(async (req, res, next) => {
  try {
    const email = "get email from jwt ...";
    req.user = await db.user.findOne({
      where: { email }
    });

    return next();
  } catch (e) {
    logger.warn("An error occurred" , e);
    res.status(500).send({ message: e.message });
  }
});

app.use("/api", api);

app.get("*", (req, res) =>
  res.status(404).json({ errorCode: 0, message: "Unrecognized route" })
);

const handler = serverless(app);

module.exports.handler = async (event, context) => {
  context.callbackWaitsForEmptyEventLoop = false;
  return handler(event, context);
};

我认为我们可能达到了最大 mysql 连接数(我的实例是 66),但是 rds 仪表板显示我们拥有的最多的是 40 年代。

我们做错了什么?

标签: mysqlaws-lambdasequelize.jsserverless-framework

解决方案


尽管您说您没有达到最大连接数,但您仍然可能想尝试Amazon RDS Proxy为您的 Lambda 函数创建一个访问,用高负载命中它,看看您是否能够重现错误。

您确实没有足够的日志来诊断问题,如果上述方法不起作用,您将需要更深入地研究,可能启用更多 RDS 日志记录以查看是否能告诉您问题所在。

您可以解决问题的其他方法是,如果您正确地使用另一种语言/框架执行相同的查询,模拟并查看问题是否仍然存在。

您可能还想检查 Cloudwatch 指标是否有任何其他信息,这些信息可以为您提供有关问题所在的线索。在同一个图表上绘制Lambda资源指标和RDS实例指标,以查看 Lambda 函数何时出错以及您的数据库正在执行的操作是否存在任何模式,例如,如果您的写入或读取延迟增加,是否会发生错误。

如果问题仍然存在,并且您无法解决它,您可以做的最好的可能是实施重试,这只会掩盖问题,但如果老板在您寻求解决方案,这可能是您最好的选择。

希望我的建议有所帮助,我遇到过与DB+Lambda&类似的问题,DB+ECS并发现这些是有效的故障排除策略。


推荐阅读