首页 > 技术文章 > 核心重点lxml

wwwzzg168 2018-10-10 17:16 原文

from lxml import html

htmlStr = html.etree.HTML(pagehtml, parser= html.etree.HTMLParser(encoding='utf-8')) #将网页源码转换为 XPath 可以解析的格式
nr= html.tostring(nr,encoding="utf-8").decode(  ) 

推荐阅读