apache-spark - 在 Web 应用程序中使用 Apache Livy (flask)
问题描述
我正在使用 Flask 构建一个具有一些实时机器学习功能的网络应用程序。我想使用 Spark Mllib 分析数据并在应用程序中实时给出结果。然后我找到了我认为可能适合我的项目的 Livy。我阅读了 Livy 的文档,我了解到我可以像这样通过 Livy 将代码片段发送到 spark 集群
data = {'code': textwrap.dedent("""
val NUM_SAMPLES = 100000;
val count = sc.parallelize(1 to NUM_SAMPLES).map { i =>
val x = Math.random();
val y = Math.random();
if (x*x + y*y < 1) 1 else 0
}.reduce(_ + _);
println(\"Pi is roughly \" + 4.0 * count / NUM_SAMPLES)
""")}
我的情况是我的应用程序后端有大量数据(数千行 json 格式的数据),我想用 Spark 进行分析。我的问题是如何使用 Livy 将数据传递给 Spark?我找不到任何具有大型数据集的工作示例。
解决方案
推荐阅读
- php - 如何从控制器在后台运行 php artisan 命令?
- sharepoint - 需要获取托管在企业共享点在线根站点内的用户站点的驱动器
- python - 展开角以获得连续相位
- ios - Child UIViewController view prevents container UIViewController views from receiving touch events
- c# - wpd c#在存在多个设备时枚举设备内容
- javascript - three.js 中的第一人称动画
- angular - 如果我导航到延迟加载的模块,Angular Universal 中的社交共享不起作用?
- html - 悬停时菜单列表略微向右移动
- joomla - Phoca Gallery -> 幻灯片显示文件名而不是类别 (Joomla 3.x)
- python - 向用户发送文件会在 Flask 框架中产生 UnicodeEncodeError