amazon-s3 - 如何阻止 google-bot 索引我的 s3 存储桶中的文件夹?
问题描述
我有一个带有静态网站托管设置 + 云端的亚马逊 s3 存储桶。我在 s3 存储桶 [example.com/Books] 中有一个文件夹,其中包含 pdf 文件。我已经在 google 搜索控制台 [不包含任何 pdf url] 中提交了站点地图,但 google 正在搜索结果中索引 pdf 文件。
在搜索控制台中,我添加了一个从搜索结果中删除所有带有前缀 [example.com/Books/*] 的 url 的请求,以便立即删除。我搜索了如何停止索引文件和文件夹,发现我必须添加“X-Robots-Tag: noindex”作为 http 标头元数据。如何将其添加到 s3 存储桶?我已将自定义元数据添加到文件夹 'Books' x-amz-meta-X-Robots-Tag: noindex。
我已经阅读了许多帖子,其中写到我不应该阻止机器人使用 Robots.txt 访问该文件夹,因为它不会告诉搜索引擎我已添加到该文件夹的“noindex” http 标头。现在要做什么 ?
解决方案
您可以使用 robots.txt 它适用于所有搜索引擎机器人。
robots.txt使用与我给出的完全相同的文件名。
User-agent: *
Disallow: /foldername/
推荐阅读
- javascript - bot.sendMessage 不是函数
- mysql - 选择语句:选择引用先前的选择查询
- git - git pull 无密码
- date - 更好地控制 Dialogflow 的日期期间
- javascript - 如何禁用加载页面的具体功能?
- css - “nav nav-pills nav-justified”类不堆叠移动视图的选项卡
- php - 编写 PHP 代码以打印以下数字模式
- angular - 有没有办法清除 rxjs 超时,以便在允许用户再次登录而不会超时后,我可以使用 retrywhen 重试 http 请求?
- http - 使用 Go 标准库,为什么我在这种两层架构中不断泄漏 TCP 连接?
- python - 如何使生成器中的范围数工作