java - 如何使用 SAX 处理程序分析 JAVA DOM 文档?
问题描述
我将在我的代码中编写一个新功能,以一种内存/CPU 高效的方式处理一些 XML 数据。它将主要分析来自文件、流、字节数组等的数据,因此 SAXParser 似乎符合上述所有要求。
不幸的是,这个新功能还需要分析一些由使用 DOM 解决方案并返回 Document 类的旧代码生成的 XML 数据。
当然,我可以将该 DOM 文档保存到文件/流/字节数组等中,然后使用 SAXParser 来处理它,但是这种解决方案需要额外的内存空间来保存从数据处理角度来看完全没有必要的数据。
因此,我正在寻找某种 DOM 文档爬虫,它可以读取已经存在的 DOM 数据,但使用 SAX 处理程序来处理它,这将允许我在自定义 SAX 处理程序中只实现一次基本处理逻辑,还可以使用任何类型的输入数据。
你遇到过这样的事情吗?
解决方案
您使用身份转换将 XML 从 DOM 树提供给 SAX 处理程序:
TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
transformer.transform(new DOMSource(document),
new SAXResult(handler));
构造DOMSource
函数需要一个Node
,所以你可以只给它一个 DOM 文档的一部分,即一个片段。
构造SAXResult
函数采用ContentHandler
您通常会XMLReader
在setContentHandler(...)
调用中给予的 。