python - 如何使用 MRJob 在 Hadoop 集群中运行 Python 库?
问题描述
我有一个load.file.py
使用Bio
库来读取基因序列的 python 文件。
from mrjob.job import MRJob
from Bio import SeqIO
我在伪分布式模式下使用 Hadoop,当我使用以下命令运行代码时:
python load_file.py hdfs://localhost:9000/user/username/input/data.fna -r hadoop
但它无法运行并在stderr
文件中给我这个错误:
File "load_file.py", line 2, in <module>
from Bio import SeqIO
ModuleNotFoundError: No module named 'Bio'
如何在 Hadoop 集群中安装该库以便它可以运行我的代码?mrjob
我确实使用文档中的字数统计教程测试了我的设置,它运行正常。
解决方案
推荐阅读
- python - 当我激活覆盆子 gpio 时向客户端发送 json 响应
- reactjs - react redux mapStateToProps - 正确的道具没有进入组件
- c# - 使用 linq 使用项目修改更新列表
- linux - 如何从 struct pci_dev 获取总线/设备/编号?
- django - 如何在过滤器上使用注释而不是循环
- lua - 在haproxy中调用lua响应503
- javascript - SyntaxError: Unexpected token : 在 TypeScript 中使用 Aurelia 运行玩笑测试时
- python - 如何从同级 __init__.py 导入?
- c++ - if vs if constexpr inside constexpr 函数
- powershell - Powershell脚本没有执行过去的for循环