database - 哪个是存储 JSON 数据以执行分析的最佳数据库
问题描述
我想对请求和响应信息进行分析,以了解用户的脉搏并以更好的方式为他们服务。
为了做到这一点,我开始将请求和响应信息以 json 格式存储到 cassandra,因为我们在项目中同时使用 mysql 和 cassandra,并且内容的大小不超过 20 个属性(键值对),其中响应属性有一些文本段落作为响应。
寻找一些关于在哪里存储(哪个数据库)这个 JSON 信息以及我们可以使用什么样的分析工具的想法。
解决方案
我想了解有关您的配置的更多信息。据我了解,由于您正在运行 Cassandra,因此数据可能在 NoSQL 中。
选择数据库取决于几个参数,如数据字段的模块化、数据传输的速度和业务需求。
数据的分析与数据的复杂性和列的统计意义相关。如果需要在内存中运行计算,可以使用 SAS。对于高级统计分析,请使用基于 R 或 Python 的分析。使用 Python 进行分析是最好的选择,因为它使您能够开发复杂或更简单的系统。
如果您完全从零开始。我的建议是从业务需求倒退到表格设计。
- 首先了解分析试图解决的问题。
- 确定数据列的相关性。
- 确定您是否希望数据库准备好 2 个连接或 3 个或更多连接。
- 使用前面提到的参数,决定 NoSQL、PostGres 还是 SQL。如果您正在处理大数据,请使用 NoSQL、XML 并避免使用 Oracle。
链接:
推荐阅读
- mysql - 过滤 ipv4 范围时的 sql 性能
- mysql - mysql。如何组合或匹配两个表中的特定行
- python - 与列表理解相比,是否有用于连接此 2d 列表的矢量化方法?
- php - 用户可以在浏览器中更改会话变量吗
- react-native - React Native this.setState 的文本
- android - TLS握手错误,但仅在访问相机时刷新移动页面
- java - Java中的addAfter()单链表实现
- c++ - OpenCV - 内存位置的合并功能异常
- unity3d - Unity Pass 原始四元数弧度数据
- python-3.x - Astropy/SkyCoord:如何让 x 轴显示完整度数范围,而不是角度 > 180 的负数?