首页 > 技术文章 > 快速从html页面解析出数据

dearddu 2020-03-18 23:41 原文

如何快速从html页面解析出我们想要的数据

爬虫基本入门方法

 

场景:

1、当接口返回接口为xml

2、想从页面上解析想要的数据文本

 

 

使用

pip3 install lxml

 

import request

from lxml import etree

 

r = requests.post(url,data).text

 

#复制html内容

html_demo = '  '

#使用etree.HTML 解析html的内容

#demo = etree.HTML(html_demo) 

demo = etree.HTML( r ) 

nodes = demo.xpath(' ')  #填xpath路径

 

#获取文本

t = nodes[0].text

print(t)

 

推荐阅读