html - 如何在没有空格规范化的情况下从元素中获取文本并在 swift 中使用 SwiftSoup 进行修剪
问题描述
我想使用 SwiftSoup 库在没有空白规范化和修剪的情况下获得准确的文本。
目前,SwiftSoup 提供 element.text() 方法来从该元素中提取文本。
但是 text()- 方法给出了修剪和空白规范化的文本。
任何其他方式来获取元素文本而不进行修剪和空白规范化?
解决方案
这不是 SwiftSoup 特定的,但对于 HTML DOM 应该是正确的,并且在这里可能类似:
innerText 属性只返回文本,没有间距和内部元素标签。
innerHTML 属性返回文本,包括所有间距和内部元素标记。
textContent 属性返回带间距的文本,但没有内部元素标签。
https://www.w3schools.com/jsref/prop_node_innertext.asp
不确定如何textContent
使用 SwiftSoup(如果存在)访问该属性,但这可能就是您想要的。
万一.html()
不适合你。
推荐阅读
- apache-spark - 使用滞后函数后将 null 替换为数据框中的另一个值
- python-3.x - 如何在 Python 中编写递归函数?
- javascript - JavaScript - “组合”两个相似的对象数组
- firebase - 如何在 Firebase 云功能中更新文档
- mysql - 安装 MYSQL 时尝试使用 root 用户连接到 Mysql@localhost:3306 且没有密码错误
- php - Prestashop 1.6 中的产品条件
- html - 在 Chrome 和 Firefox 中不显示背景图像
- java - 带有参数的 Elasticsearch java HighLevel 客户端更新脚本
- c++ - 这种使用指向实例的指针创建分离的 std::thread 的方式是否错误?
- python-3.x - Python 3 - 安装新模块时出现 WinError 87