apache-spark - Code to connect to Sharepoint from PySpark
问题描述
I want to extract SharePoint List data using PySpark. I am not sure about the Sharepoint list data and storage. I want to read the SharePoint list data as a PySpark data frame.
I have tried Python Libraies: Sharepy Slum Sharepoint and many others
解决方案
假设您使用的是 databricks 中的 pyspark,我使用的是不同的方法。我正在使用 office 365 powerautomate 流将共享点列表存储在 azure 数据存储中作为 csv 文件。这些流程可以通过在 python 中调用电源自动化的 http 触发器从数据块中调用,或者您可以在数据更改发生时自动更新电源自动化。然后可以将 csv 文件挂载为 sql 分析中的表,并在数据块中轻松使用。好处是微软提供了易于使用的无代码解决方案来将 sharpoint 导出到 azure 存储,它还可以处理所有的安全细微差别。
推荐阅读
- reactjs - 返回组件数组的 React 自定义 Hook
- python - 如何动态访问json文件中的所有项目
- python-3.x - 相关字段查找无效:带有 search_fields 的图标
- bash - 用于检查合并分支的 Bash 脚本
- leaflet - Leaflet - 为什么当我在浏览器中查看 html 时,我在 QGIS 中创建的操作不起作用
- python - 请求不断返回 403 状态,即使遵循 api 文档中的每一步
- mysql - 如何在 MySQL 5.7 中的两个日期之间每月仅计算工作日(周一至周五)?
- javascript - 在窗口调整大小时保持内容位置?
- reporting-services - SSRS 参数字段不会在“预览”模式下更新
- qt-creator - 时间轴播放头在移动时不更新关键帧值