首页 > 解决方案 > 在 Azure Databricks 中读取 Twitter 流数据

问题描述

我想使用 pyspark 在 Azure Databricks 中读取流式 Twitter 数据,但我不知道该怎么做?我在互联网上找到了几个链接,但它们都需要我本地机器的 hostid 或 IP 地址,但是因为我想在云上这样做,有什么方法或其他代码可以这样做吗?

https://towardsdatascience.com/sentiment-analysis-on-streaming-twitter-data-using-spark-structured-streaming-python-fc873684bfe3 上面的链接显示了如何在本地机器上阅读。

谢谢, 苏比

标签: pythonpysparkspark-streamingdatabricksazure-databricks

解决方案


你可以使用socket.gethostname()它,它也应该可以工作。


推荐阅读