首页 > 解决方案 > 删除 HTML 页面中的部分 HTML

问题描述

我试图在加载页面时删除一些带有内容的标签,以限制不发送几个标签。

我正在使用搜索字符串,它对更大的数据集没有帮助。

string startTag = "<section>"+Environment.NewLine+
"                <div id=\"nonPrintable123\">";

        var startIndex = htmlString.IndexOf(startTag);
        var html = htmlString.Substring(0, startIndex) + "</div></form>      </body></html>";

有什么办法可以让我使用正则表达式并用空字符串删除/替换整个 div- 子项?

内部的数据<Section> {data} </Section> 应替换为空或任何其他抑制。

标签: htmlregexvb.netsubstringmeta-tags

解决方案


过去使用 String.Replace 对我有用。
https://docs.microsoft.com/en-us/dotnet/api/system.string.replace?view=netframework-4.7.2

startString &= startString.Replace("<div>HTML you want to replace</div>", "")

推荐阅读