python - 需要通过 /etc/hosts 在系统范围内过滤 Adblockplus
问题描述
我正在抓取一些网站以获取他们selenium
在 python 中使用的内容。我可以在功能设置为启用扩展的情况下通过无头运行,并且效果firefox
很好。但是(截至 2021 年 3 月)的最新版本不支持性能日志记录——这对于我的目的来说是必须的。所以我不得不切换到使用和 Chromium。日志记录效果很好,但在无头模式下运行时 chromium 不支持浏览器扩展并引发错误。geckodriver
marionette
True
adblockplus
firefox
chromedriver
因此,我认为我继续使用chromedriver
Chromium,但没有adblockplus
或任何其他广告拦截确实会损害我的运行时间,并且有一些叠加层在其他情况下不会出现。
如何找到并提取我的adblockplus
浏览器扩展的过滤器列表,以便我可以通过使用其中的域名和我的/etc/hosts
文件应用相同的过滤,即将所有这些“坏”域发送到 0.0.0.0
解决方案
如果您打开设置并单击高级。你会看到过滤器。每个过滤器都指向一个存储地址的 url。
1.我之前链接的简单列表:https ://easylist-downloads.adblockplus.org/easylist.txt 2.ABP过滤器https://easylist-downloads.adblockplus.org/abp-filters-anti-cv.txt
推荐阅读
- angular - 产品未在 app.component.html 中列出
- laravel - 控制器上的对象突然变成视图中的数组
- javascript - 使用 JavaScript + CSS 的 Toast 通知在登录页面上无法正常工作(node.js + express + passport + MongoDB)
- python - 使用与用户的 OneToOneField 关系使用 is_authenticated
- r - 条形图未显示每个类别
- jquery - CSS - 如果两个子 div 相互跟随,则为它们设置样式
- mysql - 使用 JOIN 或 UNION 使用来自其他 MariaDB 表的数据的复杂 INSERT 或 UPDATE MariaDB 表
- html - When i hover my icon for make it bigger, my page moving
- reactjs - 将 cors 添加到此代码段以允许所有来源
- python - 根据 Python Pandas 中列中的值计算年龄时出错?