python - 尝试使用 python、pypeteer 进行 websrap
问题描述
目标是从跟踪 tiktok 关注者的网站中提取信息并将其发布到控制台/发送到不和谐频道。目前使用不和谐来启动它,但让它在控制台中打印。下面列出的当前代码打印:
[<pyppeteer.element_handle.ElementHandle 对象在 0x00000214B2703640>]
@bot.command()
async def stats(ctx):
statspage = await browser.newPage()
await statspage.goto('https://livecounts.io/tiktok-live-follower-counter/charlieputh')
t = await statspage.xpath('//*[@id="__next"]/div/div/div[3]/div[2]/div/div/div/div')
print(t)
我希望它返回该页面上列出的关注者数量。请帮忙。
解决方案
该page.xpath
函数为您提供元素的列表,而不是文本。如果要获取元素的文本,则需要对其进行评估,例如:
elements = await statspage.xpath('//*[@id="__next"]/div/div/div[3]/div[2]/div/div/div/div')
text = await page.evaluate("e => e.innerText", elements[0])
您可能知道,pyppeteer 是 puppeteer 的非官方 Python 版本,因此您应该查看 puppeteer 的文档以了解它是如何工作的。还有pyppeteer的文档,看看 Python 版本有什么不同。
推荐阅读
- flutter - 实现概述文本字段在颤动的下拉菜单中输入带有标签文本
- css - 如何为不同的页面下一个js使用两个不同的全局css?
- vba - VBA 函数第一次正确返回一个值,但在第二次运行时则不正确
- swift - 使用 [UInt8] 的 Alamofire 发布请求
- amazon-web-services - 为 aws ec2 负载均衡器设置 http 基本授权密码
- sql-server - 尽管数据很小,但字符串列的 Power BI 字典大小都超过 1mb
- ios - 设备定向后子视图的中心
- r - R 在安装 gert 时因“捕获非法操作”而崩溃
- python - Matplotlib 图 '.supxlabel' 不起作用
- python - 如何正确填写表格