首页 > 解决方案 > SageMaker 在本地模式下使用调试器

问题描述

抽象的

我正在尝试以 amazon-sagemaker-examples 的“本地模式”测试 SageMaker调试示例。我正在尝试使用 AWS SageMaker Notebook 实例在“本地模式”中查看相同的调试结果。

我做了什么

我在其中一个示例中添加了几行代码,以便在amazon-sagemaker-local-mode-example引用的“本地模式”中使用它。这个例子是tf-mnist-builtin-rule.ipynb。注释行是示例中的原始代码

import subprocess
# import boto3
from sagemaker.local import LocalSession
from sagemaker.tensorflow import TensorFlow

instance_type = 'local'
try:
    if subprocess.call("nvidia-smi") == 0:
        instance_type = "local_gpu"
except:
    pass
session = LocalSession()
session.config = {'local': {'local_code': True}}
# session = boto3.session.Session()
# region = session.region_name
role = 'arn:aws:iam::111111111111:role/service-role/AmazonSageMaker-ExecutionRole-20200101T000001'
estimator = TensorFlow(
    # role=sagemaker.get_execution_role(),
    role=role,
    instance_count=1,
    # instance_type="ml.p3.8xlarge",
    instance_type=instance_type,
    # image_uri=f"763104351884.dkr.ecr.{region}.amazonaws.com/tensorflow-training:2.3.1-gpu-py37-cu110-ubuntu18.04",
    framework_version='2.4.1',
    py_version="py37",
    max_run=3600,
    source_dir="./src",
    entry_point="tf-resnet50-cifar10.py",
    # Debugger Parameters
    rules=built_in_rules,
    sagemaker_session=session,
)

问题:

与 AWS SageMaker Notebook 实例不同,我无法实时查看调试报告。示例中的wait=false选项(见图)使笔记本继续运行,尽管它仍在运行但不在“本地模式”下工作。

在此处输入图像描述

问题:

任何想法使wait=False选项在“本地模式”下工作?

谢谢阅读。

标签: pythonamazon-web-servicestensorflow

解决方案


推荐阅读