首页 > 解决方案 > 当我在 s3 中更新文件时,数据集会自动更新吗?还是我需要再次创建导入作业

问题描述

我通过从 Amazon 个性化的 s3 存储桶导入数据创建了一个数据集。现在我对在实际项目中添加新用户或新项目时如何更新数据集有两个疑问。

  1. 我需要更新 s3 本身的文件吗?如果这是唯一的方法,当我在 s3 中更新文件时,数据集会自动更新吗?还是我需要再次创建导入作业。
  2. 有什么方法可以更新项目和用户,就像我们通过调用 put_events 方法来更新交互一样。?

https://forums.aws.amazon.com/thread.jspa?messageID=952809觩

标签: pythonamazon-web-servicesamazon-s3amazon-personalize

解决方案


更新 [2020/10/13]

Personalize 最近添加了一个新的 API 端点,可用于实时放置用户和项目,就像交互一样。

您可以在这里查看: https ://docs.aws.amazon.com/personalize/latest/dg/API_UBS_PutItems.html https://docs.aws.amazon.com/personalize/latest/dg/API_UBS_PutUsers.html

如果用户/项目已经存在,那么它将被一个新值覆盖。

也无法删除给定的用户/项目。

如果要更新 Items/Users 数据集,您必须: 1. 将新转储导出到 S3。2. 在 Personalize 中创建新的导入作业。3. 等待它完成。4. 重新培训解决方案(如果有)。对于仅使用新项目/用户更新解决方案,您不需要进行全面的再培训,更新就足够了。

4.您可以在此处找到更多详细信息,查找--training-mode参数: https ://docs.aws.amazon.com/cli/latest/reference/personalize/create-solution-version.html

不幸的是,没有实时更新它的选项。最简单的方法是创建 AWS Lambda,它将每隔几个小时/天更新一次,这取决于您的源数据集更改的频率。


推荐阅读