web-crawler - 如何使用 crawler4j 添加(集成) crawljax?
问题描述
我正在研究网络爬虫,它使用 crawler4j 从网站获取数据,一切顺利,但主要问题是基于 ajax 的事件。所以,我发现 crawljax 库确实很重要,但我不知道何时何地使用它。
我什么时候使用它(我的意思是工作序列)?
- 在使用 crawler4j 获取页面之前。
或者
- 使用 crawler4j 获取页面后。
或者
- 我是否使用了使用 crawler4j 的 url,并使用它使用 crawljax 获取 Ajax 数据(页面)。
解决方案
推荐阅读
- bash - gcloud 命令行重定向到标准输出
- c++ - cmake error libcurl not found, but libcurl4 is installed
- python - _root_logger_handlers_backup = _root_logger.handlers.copy() AttributeError: 'list' 对象没有属性 'copy'?
- java - 删除白色轮廓 JFrame
- python - Pyspark - UnicodeEncodeError:“ascii”编解码器无法在位置 124 编码字符“\ufffd”:序数不在范围内(128)
- wordpress - 无法将 Wordpress 从一台服务器迁移到另一台服务器
- python - 如何将多个现有数据框值更改为 nan
- python - sqlalchemy.exc.IntegrityError:重复键值违反唯一约束“user_pkey”
- javascript - JavaScript 的奥秘似乎没有人能够弄清楚 - 复制到剪贴板并不总是在相同的值上工作。没有错误
- java - 使用 spring @Query 获取节点和关系列表