text - 如何从我的 Rust 中的 HTML 中删除所有空格和 ASCII 元素,如“\n”?
问题描述
我正在写一些东西来从亚马逊提取产品数据,但我不确定如何规范 HTML 中的空白。
fn parse_html(html: std::string::String) {
let fragment = Html::parse_fragment(&html);
let product_title = Selector::parse(".s-line-clamp-2").unwrap();
for title in fragment.select(&product_title) {
let title_txt = title.text().collect::<Vec<_>>();
println!("{:?}", title_txt);
}
}
这可行,但我得到的数据是这样的["\n \n \n \n\n\n\n\n", "\n \n \n \n ", "Men\'s Sneakers", "\n \n \n \n \n", "\n\n \n"]
我只想要这个:["Men\'s Sneakers"]
解决方案
推荐阅读
- java - 使用带有片段适配器的 Glide 库
- python - 在python的except语句中传递给异常的参数引发TypeError
- c++ - 如果使用向量作为容器,如何弹出队列
- python - 如何使用变量中的值更新嵌套 Python 字典中的键?
- ios - iPhone 本身可以充当 NFC 标签吗?
- r - 使用 knitr::include_graphics 将图像插入 RMarkdown 时替换文本?
- php - 如何使用 MySql 查询返回数组值(来自 PHP)
- c# - 在异步循环中等待上一项
- intellij-idea - 如何关闭 SQL 文件中的数据库导航器建议
- installation - 后期 kubernetes 安装支持