python - 当我在 s3 中更新文件时,数据集会自动更新吗?还是我需要再次创建导入作业
问题描述
我通过从 Amazon 个性化的 s3 存储桶导入数据创建了一个数据集。现在我对在实际项目中添加新用户或新项目时如何更新数据集有两个疑问。
- 我需要更新 s3 本身的文件吗?如果这是唯一的方法,当我在 s3 中更新文件时,数据集会自动更新吗?还是我需要再次创建导入作业。
- 有什么方法可以更新项目和用户,就像我们通过调用 put_events 方法来更新交互一样。?
解决方案
更新 [2020/10/13]
Personalize 最近添加了一个新的 API 端点,可用于实时放置用户和项目,就像交互一样。
您可以在这里查看: https ://docs.aws.amazon.com/personalize/latest/dg/API_UBS_PutItems.html https://docs.aws.amazon.com/personalize/latest/dg/API_UBS_PutUsers.html
如果用户/项目已经存在,那么它将被一个新值覆盖。
也无法删除给定的用户/项目。
4.您可以在此处找到更多详细信息,查找--training-mode
参数:
https ://docs.aws.amazon.com/cli/latest/reference/personalize/create-solution-version.html
不幸的是,没有实时更新它的选项。最简单的方法是创建 AWS Lambda,它将每隔几个小时/天更新一次,这取决于您的源数据集更改的频率。
推荐阅读
- github - 在 AWX 上更新 Git 子模块
- google-chrome-extension - 在客户端操作之前获取页面的服务器响应
- python - 循环遍历 wx.TextCtrl.GetValue() 以启用处理重复单词时继续跟踪单词的位置
- splunk - Splunk 错误指定至少一个命名组
- angular - 从角度选项中提取 id
- python - FileNotFoundError: [Errno 2] No such file or directory althoguh the file exists
- python-3.x - 尝试绘制两个 numpy 数组时我做错了什么?
- python - 运行多个 Tornado 实例会导致 ioloop is already running 错误
- angular - 如何突出显示ngrx-charts中的activeEntries
- python - 是否可以为 Pandas pivot_table 方法值参数分配一个类参数