java - 从字符串中提取文本
问题描述
我关注的是 HTML 字符串 -
<html>
<head>
<title>Repository</title>
</head>
<body>
<h2>Subversion</h2>
<ul>
<li>
<a href="../">..</a>
</li>
<li>
<a href="branch_A/">branch_A</a>
</li>
<li>
<a href="branch_B/">branch_B</a>
</li>
</ul>
</body>
</html>
为此,我想获得标签的li
标签,即branch_A
Count branch_B
of的标签li
可能会有所不同。我想得到所有这些。你能帮助我如何解析这个字符串并获取这些值吗?
注意我可以使用jsoup
库来实现相同的目标,但考虑到我们的项目限制,我不能使用它。
解决方案
您可以为此使用 HTML 解析器。在下面的代码中使用了 jsoup ( https://www.baeldung.com/java-with-jsoup ),而且它快速简单。
Document doc = Jsoup.connect(fix url here).get();
doc.select(tag you want).forEach(System.out::println);
此处讨论其他工具:https ://tomassetti.me/parsing-html/
推荐阅读
- php - LDAP 配置 Laravel5 - 未定义身份验证用户提供程序 [adldap]
- swiftui - 如何在 SwiftUI 中自定义角度变化的动画
- php - 将引导主题覆盖到 word press
- python - 使用神经网络进行分类
- c# - 属性更改时如何进行 UIElement 更改?
- react-native - 即使翻译存在,react-native-localize 也缺少翻译问题
- sql - postgres 从具有额外依赖项的表中选择值
- python - 数据框中列的字典值
- gcloud - StackDriver 过滤器适用于 UI,不适用于 gcloud
- reactjs - React 路由器不会更改视图,但会更改 url - 应用程序在 iframe 中加载