html - 使用 Selenium Python 和选择器进行爬网
问题描述
我正在编写一个测试脚本来抓取来自 LinkedIn 用户的一些数据。除了个人技能外,几乎一切对我来说都很好。您可以在下面看到该部分的 HTML 结构:
<div class="pv-deferred-area__content">
<section id=".." class="pv-profile-section pv-skill-categories-section artdeco-card mt4 p5 ember-view">
<div class="display-flex">...</div>
<ol class="...">
<li id="..." class="...">
<div class="..." ...>
<div ...>
<p ... >
<a...>
<spam class="pv-skill-category-entity__name-text t-16 t-black t-bold">SkillName</spam>
</a>
</p>
</div>
</div>
</li>
</ol>
使用 Selector,我得到了页面的源代码:
sel = Selector(text=driver.page_source)
现在,我要做的就是获取所需的信息:
skills = sel.xpath('//*[starts-with(@class, "ppv-skill-category-entity__name-text t-16 t-black '
't-bold")] / text()').extract()
但是,返回的列表是空的。这里有什么问题?
解决方案
推荐阅读
- javascript - 为什么我的返回语句在我的节点服务器文件中返回 null?
- sql - 显示所有 50 岁以上客户的名字、生日和年龄
- sharepoint - SharePoint Online O365 从齿轮菜单中隐藏网站内容
- javascript - 如何在javascript中暂停整个脚本一段时间?这甚至可能吗?
- python - 带有变量的 PyMongo 查询不返回任何结果
- json - 如何在反应中从 API 返回特定数量的项目?
- flutter - 未定义的名称“上下文”。尝试将名称更正为已定义的名称
- amazon-web-services - 检测选择状态内 AWS StepFunctions 状态机定义的更新
- r - 为不同的州创建县级邻接矩阵
- ruby-on-rails - 如何在 VSCode 中使用 WSL 访问 windows 文件?