python - SageMaker 在本地模式下使用调试器
问题描述
抽象的
我正在尝试以 amazon-sagemaker-examples 的“本地模式”测试 SageMaker调试器示例。我正在尝试使用 AWS SageMaker Notebook 实例在“本地模式”中查看相同的调试结果。
我做了什么
我在其中一个示例中添加了几行代码,以便在amazon-sagemaker-local-mode-example引用的“本地模式”中使用它。这个例子是tf-mnist-builtin-rule.ipynb。注释行是示例中的原始代码
import subprocess
# import boto3
from sagemaker.local import LocalSession
from sagemaker.tensorflow import TensorFlow
instance_type = 'local'
try:
if subprocess.call("nvidia-smi") == 0:
instance_type = "local_gpu"
except:
pass
session = LocalSession()
session.config = {'local': {'local_code': True}}
# session = boto3.session.Session()
# region = session.region_name
role = 'arn:aws:iam::111111111111:role/service-role/AmazonSageMaker-ExecutionRole-20200101T000001'
estimator = TensorFlow(
# role=sagemaker.get_execution_role(),
role=role,
instance_count=1,
# instance_type="ml.p3.8xlarge",
instance_type=instance_type,
# image_uri=f"763104351884.dkr.ecr.{region}.amazonaws.com/tensorflow-training:2.3.1-gpu-py37-cu110-ubuntu18.04",
framework_version='2.4.1',
py_version="py37",
max_run=3600,
source_dir="./src",
entry_point="tf-resnet50-cifar10.py",
# Debugger Parameters
rules=built_in_rules,
sagemaker_session=session,
)
问题:
与 AWS SageMaker Notebook 实例不同,我无法实时查看调试报告。示例中的wait=false
选项(见图)使笔记本继续运行,尽管它仍在运行但不在“本地模式”下工作。
问题:
任何想法使wait=False
选项在“本地模式”下工作?
谢谢阅读。
解决方案
推荐阅读
- linux - 多个进程的多个中断向量表
- graphql - 我的 Gatsby GraphQL 架构不会使用新的 Sanity 架构进行更新
- regex - 使用正则表达式从 Pyspark 中的描述中获取数量
- asp.net-core - UserManager 引发异常 - 无法跟踪实体,因为主键属性“Id”为空 - 从 .Net Core 2.2 升级到 3.0 后
- angular - Angular Cli 工作区之外的 Angular 库
- python - 按递增顺序重命名多个不同扩展名的同名文件
- sql - 如何在 oracle 中将 2 列 1 行移动到 1 列 2 行
- ios - 在 webview 中出现这样的错误尝试嵌入平台视图但 PaintContext 不支持嵌入
- sql - 如何使用powershell在不提示的情况下获取凭据对象
- excel - 将 CSV 导入新工作表