seo - 允许 robots.txt 中的某些参数
问题描述
我的 robots.txt 中有这个,需要留在那里:
不允许: /*?
但是,我还需要 Google 索引在 url 末尾有 ?amp 的页面。像这样:
www.domain.com/product-name?amp=1
有没有办法允许robots.txt中的那些,但也保留前面提到的Disallow?
解决方案
引用 Google 的文档:
在组成员级别,特别是对于允许和禁止指令,基于 [path] 条目长度的最具体的规则胜过不太具体(较短)的规则。在规则冲突的情况下,包括带有通配符的规则,使用限制最少的规则。
这意味着如果允许 ?amp 但不允许其上方的文件夹,则应首先遵循更具体的规则并允许 amp 页面,但不允许层次结构中更高的任何内容。
推荐阅读
- r - 将 DF 中一列中的数字(整数)拆分为 4 个新列 R
- python - 计算 y 边滚动 x 骰子的所有可能总和
- c# - Apache.NMS.NMSConnectionException:“连接到 activemqhost 时出错:61616。”
- javascript - 在 React-Redux 中未更新 InitialState
- sql - SQL - 如何有条件地调用查询的一部分
- google-cloud-platform - 在 gcloud 上添加 gpu 的选项不可用?
- python - 如何使用 numpy 将导入的 csv 中的一列从字符串转换为浮点数?
- javascript - Firebase Cloud Function 获取大型集合中的所有文档不起作用
- typescript - 如何在nestjs中动态连接数据库?
- c# - 仅当 LINQ 中的条件时选择