python - 在 Python/PySpark 中找不到模块“preproc”
问题描述
我正在尝试遵循本教程:https ://runawayhorse001.github.io/LearningApacheSpark/textmining.html
我已将数据加载到 PySpark DataFrame 中,但是当我进入预处理步骤时,我收到错误消息“ModuleNotFoundError: No module named 'preproc'” 我在网上找不到任何关于 pip install 的信息以便能够使用 preproc 模块。
!pip install preproc 在 Jupyter 笔记本中返回,“默认为用户安装,因为正常的站点包不可写警告:pip 正在由旧的脚本包装器调用。这将在 pip 的未来版本中失败。请参阅https:/ /github.com/pypa/pip/issues/5599获取有关修复潜在问题的建议。为避免此问题,您可以使用“-m pip”调用 Python,而不是直接运行 pip。错误:找不到满足要求 preproc(来自版本:无)错误:未找到 preproc 的匹配分发“
python -m pip install preproc 在 cmd 中返回,“错误:找不到满足 preproc 要求的版本(来自版本:无)错误:找不到 preproc 的匹配分发”
如何继续查找要安装的正确软件包?
解决方案
向教程创建者发送电子邮件,并将他的回复发布给将来需要帮助的任何人。
“preproc 模块是为预处理功能设计的,例如 check_blanns、check_lang、remove_features 等。如果明确包含这些功能,则不需要导入 preproc 模块。”
推荐阅读
- python - Python module not found 错误,pyCharm 一直说没有模块名称 basicconcepts
- scala - 如何在 Scala 的 Flink 中定义 KeySelector?
- machine-learning - 我应该沿着样本标准化还是应该标准化特征?
- python - 使用 Pyinstaller 编译的应用程序无法在其他机器上启动(OSError: dlopen() failed to load a library)
- python - 如何从Python中的自定义导入文件访问嵌套@classmethod中的变量?
- gravity-forms-plugin - 如何通过重力表单获取客户上传的文件。
- python - 如何在二进制文件中附加熊猫数据帧并从附加的二进制文件中获取一个数据帧?
- java - 如何在 JFrame 中设置默认点击的 JTextArea?
- asp.net-web-api2 - Webapi 的内容安全策略标头
- angular - 使用 Angular 6 中的反应形式的递归形式(树视图)