首页 > 解决方案 > 从同一网站的不同链接中获取数据

问题描述

感谢您抽出宝贵的时间阅读本文文本文件,每个文件在不同的行

标签: pythonvb.net

解决方案


我想如果我理解您需要链接中的用户名。

facebook.com/zuck

acebook.com/moskov

您可以跟踪并提取页面标题,这可能并不总是准确的。

>   <title id="pageTitle">Mark Zuckerberg</title>  
>   <title id="pageTitle">Dustin Moskovitz</title>

html2text 是一个 Python 脚本,可将 HTML 页面转换为干净、易于阅读的纯 ASCII 文本。更好的是,ASCII 也恰好是有效的 Markdown(文本到 HTML 格式)。 https://github.com/Alir3z4/html2text

如果您想从 url 读取,请检查以下说明 How to read html from a url in python 3


推荐阅读