python - virustotal.com 中的 Python 抓取
问题描述
我想从https://www.virustotal.com/gui/user/thor/comments获取恶意软件哈希并保存到文本文件或数据库。之后每 5 分钟刷新一次并自动将新哈希添加到文本文件或数据库。我用beautifulsoup 和request libs 尝试了它,但是这个评论没有标签(a,div 等)和类,因为评论部分适用于javascript。
我怎样才能从评论中刮掉这个散列?
感谢您的帮助。
解决方案
您需要使用像Selenium这样的东西来实际呈现网页,而不是像 beautifulsoup 这样的 html 解析器。
推荐阅读
- python - 如何在python中将db中的值与带有文件名的子字符串匹配
- arrays - 从一系列位中提取数据
- elasticsearch - “无法解析内容以映射”“意外字符 '}'
- java - sonarQube raises 使静态最终常量或非公共,并在 JNA 结构上需要时提供访问器
- neural-network - 如何将 L1 正则化添加到单层感知器网络?
- powerbi - 添加 +0 以删除 power bi 中的空白时,过滤器不起作用
- apache-kafka - 如何在 Spring Cloud Stream Kafka Binder 中为死信队列应用保留时间配置?
- vba - 访问 VBA - 无法弄清楚如何在主窗体中引用我的子窗体控件
- javascript - 发生http错误401时如何将用户转发到指定路径?
- ffmpeg - FFMPEG:如何更快地拍摄 3000 张快照?