apache - 阻止除 htaccess 之外的所有用户代理
问题描述
我目前在我的 htaccess 中使用以下指令来阻止所有不良机器人。
ErrorDocument 503 "Sitio inhabilitado temporalmente para el rastreo"
RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} ^.*(bot|crawl|spider).*$ [NC]
RewriteCond %{REQUEST_URI} !^/robots\.txt$
RewriteRule .* - [R=503,L]
但是,我想知道如何排除以下机器人:
SemrushBot-BA
站点审计机器人
SemrushBot-SI
提前致谢
注意:可能的解决方案是这样的?
所以他的最终结果将如下......
ErrorDocument 503 "Sitio inhabilitado temporalmente para el rastreo"
RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} ^.*(bot|crawl|spider).*$ [NC]
RewriteCond %{HTTP_USER_AGENT} !(SemrushBot-BA|SiteAuditBot|SemrushBot-SI) [NC]
RewriteCond %{REQUEST_URI} !^/robots\.txt$
RewriteRule .* - [R=503,L]
解决方案
推荐阅读
- pandas - pandas group_by 将自定义计算值应用于每个组并与未分组的数据框结合
- google-cloud-build - GCP CloudBuild 到达 VPC 中的 Nexus(存储库管理)节点
- parallel-processing - 在 CI 管道中,如何并行运行 2 个命令?
- automation - 自动滚动长页面以在 Puppeteer 中生成 pdf?
- node.js - 如何在nestjs警卫中克隆请求?
- azure - Microsoft Translator API 可以翻译带有特殊字符的文本吗?
- stata - 在Stata中使用stsplit和strate时如何获得人口规模而不是人年?
- html - 覆盖 html 中的 :root 和 django 模板中的 css
- mysql - 如何从sql中的单元格值中删除括号?
- javascript - 从带有子字符串的数组中查找重复项