django - Django 和 Amazon Lambda:使用 Amazon RDS 或 GraphQL 或 Amazon AppSync 处理大数据的最佳解决方案
问题描述
我们有一个包含大量数据的系统(一张表大约有 1000 万行)。我们在 Django 框架中开发它,并且我们希望使用 Amazon Lambda 来提供它。现在我对此有一些疑问: 1- 如果我们想使用 Amazon RDS (MySql, PostgresSQL),哪个更好?关系数据库是一个很好的解决方案吗?
2-我在某处读到,如果我们想在 Amazon Lambda 中使用关系数据库,Django 会为每个实例打开一个与数据库的新连接,这很糟糕。这个对吗?
3- 如果我们想使用 GraphQL 和 Graph 数据库,这是一个好的解决方案吗?或者我们可以将 Django Rest-API 和 GraphQL 结合在一起?
4- 如果我们不使用 Django 并使用 Amazon AppSync,会更好吗?我们使用这个有什么限制。
请帮我。谢谢
解决方案
GraphQL 对于图形数据非常有用,而不是时间序列。您的选择将取决于增长因子,而不是实际行。我目前运行一个有 50 亿行的 RDS 实例就好了,但问题是它会如何随着时间的推移而增加。我建议使用 S3 或 IoT 分析之类的东西来研究存档策略(这个真的很酷)。
除非您也有适当的理由(每秒+ 50),否则我不会担心并发连接。无论如何,您的数据库将是您拥有的最大的服务器。
推荐阅读
- javascript - 如何为每个配对号码添加一些文本
- java - 将 @Primary 与 spring-context-indexer 一起使用
- git - .gitattributes 中的“* text=auto eol=lf”和“* text eol=lf”有什么区别?
- node.js - 在 mongodb 中阅读然后更新的最佳方法是什么?
- java - Whatsapp 意图
- javascript - 自定义 http 标头破坏了 CORS
- javascript - JS 控制台变量输出问题
- android-studio - OnClickerListener 问题,可以在模拟器中打开应用
- amazon-web-services - 一次提交的 AWS CodePipeline 双重执行
- c# - 减少重复 - 从实例方法创建委托