perl - 如何使用 lwp 模块从 HTML 源文件中获取一个表?
问题描述
我是初学者。我想知道如何使用 LWP 模块从源 HTML 文件中获取一张表?是否可以将正则表达式与 LWP 一起使用?
解决方案
您可以使用 LWP 获取网页的 HTML 源代码。最容易的是,使用LWP::Simpleget()
中的函数。
my $html = get('http://example.com/');
现在,$html
您有一个包含 HTML 的文本字符串(可能是一个很长的文本字符串)。您可以使用任何您想从该字符串中提取数据的技术。
(提示:使用正则表达式可能是一个非常糟糕的主意。它会比您预期的要困难得多,并且可能非常脆弱。也许使用更好的工具 - 如HTML::TableExtract代替。)
推荐阅读
- julia - 为什么当我编写 if 语句时 Julia 会抛出输入错误的过早结束?
- java - 如何在 Spring-app 和 PostgreSQL 中添加 ENUM?
- python - Bokeh TapTool 单击时在 Div 中显示文本,未单击时重置为空白
- angular - 角度垫选项不能将 $event 转换为对象
- javascript - 获取 Google Chrome 控制台中响应数组中的值
- c - 如何将迭代更改为递归
- ios - 自定义类符合 MKAnnotation 和 Codable
- python - 如何以标准方式将新数组添加到现有 npz 文件中?
- flutter - 我们如何从flutter中的future方法中获取价值?
- python-3.x - 监视器屏幕关闭时如何处理机器人框架中的浏览器弹出窗口