首页 > 解决方案 > 从网页正则表达式行

问题描述

import urllib2
import re

content=urllib2.urlopen("https://ipinfo.io/AS32244")
for line in content:
        ver_regex = re.compile(r"(?:\d{1,3}\.){3}\d{1,3}(?:/\d\d?)?")
        py2_ver = ver_regex.search(line)
        print(py2_ver)

我正在使用 python 2.7.5,但每一行都没有打印出来。

搜索被拉网站的适当方法是什么?

我查看了 BeautifulSoup,但由于表格的结构,我认为它对我不起作用。

我知道正则表达式确实有效: https ://regex101.com/r/a3qE9A/1

标签: pythonregexpython-2.7urllib

解决方案


对我来说,代码有效,但会打印出太多的“无”,以至于您没有注意到匹配项。毕竟,大多数行都不匹配。这段代码清楚地显示了结果:

    py2_ver = ver_regex.search(line)
    if py2_ver:
        print(py2_ver.group())

推荐阅读