首页 > 解决方案 > 加载自己的数据以在 microsoft azure 机器学习中进行远程培训

问题描述

所以我一直在尝试使用 azure 机器学习来进行更快的模型训练。

我正在提交一个培训 .py 文件,并在该培训文件中访问我的培训数据,但是我收到了有关此的错误消息。我试过下面的代码

subscription_id = 'my_id'
resource_group = 'my_resource_group'
workspace_name = 'my_workspace'

workspace = Workspace(subscription_id, resource_group, workspace_name)

dataset = Dataset.get_by_name(workspace, name='my-dataset')

with dataset.mount() as mount_context:
    print(os.listdir(mount_context.mount_point))

data = np.load('my-data.npy')

但是我收到以下输出日志的错误和训练失败。

  File "train.py", line 29, in <module>
    data = np.load('my-data.npy')
  File "/azureml-envs/azureml_167f4dd4c85f61389bb53e00383dafbe/lib/python3.6/site-packages/numpy/lib/npyio.py", line 416, in load
    fid = stack.enter_context(open(os_fspath(file), "rb"))
FileNotFoundError: [Errno 2] No such file or directory: 'my-data.npy'

我假设我在远程机器上错误地安装了我的数据集,但是我不确定安装它或提交培训工作的正确方法是什么?

标签: pythonazureazure-machine-learning-service

解决方案


print 语句是否正确返回了目录列表?

这是一个示例笔记本,展示了如何在训练中加载数据:https ://github.com/Azure/MachineLearningNotebooks/tree/master/how-to-use-azureml/work-with-data/datasets-tutorial/scriptrun-带数据输入输出


推荐阅读