html - 如何在 Scrapy 中使用 xpath 来抓取没有类或属性的标签?
问题描述
我正在尝试抓取一个 html 文件,但标签没有任何类或 ID。有没有办法在不使用常规 '//*[class="blah"]/' 格式的情况下为此获取 xpath?
解决方案
似乎可以选择仅使用标签,但如果您想查看特定元素,则需要知道特定标签的索引
外壳中的前任
response.xpath('//html/body/table[1]')
如果body标签内有多个带有table标签的元素,那么[1]将指定第一个table标签(xpath从1开始计数)
推荐阅读
- python - 错误:尝试通过 sqlalchemy 在 postgresql 中创建数据库时出现 psycopg2.OperationalError
- haskell - 如何编写一个调用 `runStateT` 或 `runReaderT` 的函数 `run`?
- laravel - 使用 Laravel Nova 上传大文件
- r - 关于 sample_n() 的错误“sizemust be less or equal than 2 (size of data), setreplace` = TRUE to use sampling with replacement”
- angularjs - 机器人框架显示:JavascriptException:消息:javascript 错误:无法使用“[ng-app]”找到根选择器
- mysql - 在 MySQLWorkbench、Mac OS Catalina 中看不到结果集
- python - pyaudio中的通道数是什么意思?
- apache-spark - 如何在平面地图期间保持映射数据分开
- java - composing tasks with null checks within a method
- android - 无法获取未知属性 'bundleReleaseAar' Maven 发布