web-crawler - Stormcrawler 的 ContentParseFilter
问题描述
如果我将 StormCrawler 的 ContentParseFilter 设置为
"pattern": "//DIV[@id=\"site-body\"]",
这是否意味着在处理每个 url 时它会寻找指向其他页面的链接的唯一地方?我想知道我是否设置它是否会开始忽略菜单中的所有网址等。
谢谢!吉姆
解决方案
推荐阅读
- r - 如何从 R 中多个数据帧的公共列中找到 Max/Min
- actionscript-3 - 尝试将键盘事件添加到我在代码中调用舞台的子影片剪辑
- html - 带有可自定义拼写检查波浪线的 HTML 输入文本
- c - `/MT` 未解决的 Visual C 运行时函数
- node.js - 将 npm lib 与 async await 捆绑的最佳方式
- cakephp-3.0 - 在 cakephp 3 中找不到当前实体错误的表类
- javascript - 与 slim.js 的 transitionend-event 绑定
- javascript - 异步等待不解决/拒绝结果
- angularjs - 导入的类不能在带有 TypeScript 的 Angular.js 中用作服务
- python - 任何跟踪蝗虫自定义统计数据的方法