,ruby-on-rails,ruby,html-parsing,nokogiri"/>

首页 > 解决方案 > Nokogiri 在将 html 解析

解决方案


Nokogiri 主要是一个 XML 解析器,因此期望大部分是有效的 XML。尽管 HTML 看起来很像 XML,尤其是在 HTML 5 中,但有不同的规则,例如关闭标签和算法来检测诸如编码之类的东西,这使得 HTML 5 与 XML 和 XML 解析器不兼容。

在与您的问题相关的问题中,Mike Dalessio(nokogiri 维护者之一)的响应是:

Nokogiri 不支持 HTML5。您可能想查看Nokogumbo项目,该项目旨在实现与Gumbo解析器的 HTML5 兼容性。


推荐阅读