- 讲师:刘萍萍 / 谢楠
- 课时:160h
- 价格 4580 元
特色双名师解密新课程高频考点,送国家电网教材讲义,助力一次通关
配套通关班送国网在线题库一套
百度广告
JAXP是Java API for XML Processing的英文字头缩写,中文含义是:用于XML文档处理的使用Java语言编写的编程接口。JAXP支持DOM、SAX、XSLT等标准。为了增强JAXP使用上的灵活性,开发者特别为JAXP设计了一个Pluggability Layer,在Pluggability Layer的支持之下,JAXP既可以和具体实现DOM API、SAX API 的各种XML解析器(XML Parser,例如Apache Xerces)联合工作,又可以和具体执行XSLT标准的XSLT处理器(XSLT Processor,例如Apache Xalan)联合工作。应用Pluggability Layer的好处在于:我们只需要熟悉JAXP各个编程接口的定义即可,而不需要对所采用的具体的XML解析器、XSLT处理器有很深入的了解。比如在某个Java程序中,通过JAXP调用XML解析器Apache Crimson对XML文档进行处理,如果我们希望使用别的XML解析器(比如Apache Xerces),以便提高该程序的性能,那么原程序代码可能不需要任何改变,直接就可以使用(你所需要做的事情只是将包含Apache Xerces代码的jar文件加入到环境变量CLASSPATH中,而将包含Apache Crimson代码的jar文件在环境变量CLASSPATH中删除)。
目前JAXP已经应用的十分普遍了,可以说是Java语言中处理XML文档的标准API。有些初学者在学习使用JAXP的过程中,经常会提出这样的问题:我编写的程序对DOM Tree做了更新,但是当程序退出以后,原始的XML文档并没有改变,还是老样子,如何实现对原始XML文档和DOM Tree的同步更新呢?咋一看来,在JAXP中似乎没有提供相应的接口/方法/类,这是很多初学者都感到困惑的问题。的主旨就在于解决这个问题,简单的介绍几种常用的同步更新原始XML文档和DOM Tree的方法。为了缩小讨论的范围,所涉及的XML解析器仅包括Apache Crimson和Apache Xerces,而XSLT处理器仅仅使用Apache Xalan。
方法一:直接读写XML文档
这也许是最笨最原始的办法了。当程序获取DOM Tree之后,应用DOM模型的Node接口的各个方法对DOM Tree进行更新,下一步应该对原始的XML文档进行更新了。我们可以运用递归的办法或者是应用TreeWalker类,遍历整个DOM Tree,与此同时,将DOM Tree的每一个节点/元素依次写入到预先打开的原始XML文档中,当DOM Tree被遍历完全之后,DOM Tree和原始的XML文档就实现了同步更新。实际中,这个方法极少使用,不过如果你要编程实现自己的XML解析器,这种方法还是有可能用得上的。
方法二:使用XMLDocument类
使用XmlDocument类?JAXP中分明没有这个类呀!是不是搞错了?没有错!就是使用XmlDocument类,确切的说,是使用XMLDocument类的write()方法。
在上文已经提到过,JAXP可以和各种各样的XML解析器联合使用,这次我们选用的XML解析器是Apache Crimson。XmlDocument(org.apache.crimson.tree.XmlDocument)是Apache Crimson的一个类,并不包含于标准的JAXP中,难怪在JAXP的文档中找不到XmlDocument类的芳踪呢。现在问题出来了,如何应用XmlDocument类来实现更新XML文档的功能?在XMLDocument类中提供了下面三个write()方法(根据Crimson最新的版本------Apache Crimson 1.1.3):
public void write (OutputStream out) throws IOException public void write (Writer out, String encoding) throws IOException |
String name="fancy"; DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); { Document doc = parser.parse("user.XML"); doc.getDocumentElement().appendChild(newlink); } { } |
完整的例子请参考下列文件: AddRecord.java(见附件)、user.XML(见附件)。该例子的运行环境为:Windows XP Professional、JDK 1.3.1。为了能够正常编译运行AddRecord.Java这个程序,你需要到网址http://XML.apache.org/dist/crimson/去下载Apache Crimson,并将所获取的crimson.jar文件加入到环境变量CLASSPATH中。
注意:
Apache Crimson的前身是Sun Project X Parser,后来不知何故,由X Parser演变为Apache Crimson,至今Apache Crimson的很多代码都是从X Parser中直接移植过来的。比如上文用到的XmlDocument类,它在X Parser中是com.sun.xml.XmlDocument,到了Apache Crimson中摇身一变,就变成了org.apache.crimson.tree.XmlDocument类,其实它们的绝大部分代码是一样的,可能就package语句和import语句以及文件开头的一段lience有所不同而已。早期的JAXP是和X Parser捆绑在一起的,因此一些老的程序使用了com.sun.xml包,如果你现在重新编译它们,有可能不能通过,肯定就是因为这个原因。后来的JAXP和Apache Crimson捆绑在一起,比如JAXP 1.1,如果你使用JAXP 1.1,那么不需要额外下载Apache Crimson,也能够正常编译运行上面的例子(AddRecord.java)。最新的JAXP 1.2 EA(Early ACCESS)改弦更张,采用性能更好的Apache Xalan和Apache Xerces分别作为XSLT处理器和XML解析器,不能直接支持Apache Crimson了,所以如果你的开发环境采用了JAXP 1.2 EA或者是Java XML Pack(内含JAXP 1.2 EA),那么将无法直接编译运行上面的例子(AddRecord.Java),你需要额外下载并安装Apache Crimson。
方法三:使用TransformerFactory和Transformer类
在JAXP中所提供的标准的更新原始XML文档的方法就是调用XSLT引擎,亦即使用TransformerFactory和Transformer类。请看下面的Java代码片断:
//首先创建一个DOMSource对象,该构造函数的参数可以是一个Document对象 DOMSource doms = new DOMSource (doc); //创建一个File对象,代表DOM Tree所包含的数据的输出介质,这是一个XML文件。 //创建一个StreamResult对象,该构造函数的参数可以取为File对象。 //下面调用JAXP中的XSLT引擎来实现输出DOM Tree中的数据到XML文件中的功能。 //关键的一步, 调用Transformer对象 (XSLT引擎)的transform()方法,该方法的第一 |
OutputKeys类
javax.XML.transform.OutputKeys类和Java.util.Properties类配合使用,可以控制JAXP的XSLT引擎(Transformer类)输出XML文档的格式。请看下面的代码片断:
//首先创建一个TransformerFactory对象,再由此创建Transformer对象。 Transformer t=tf.newTransformer (); //获取Transformser对象的输出属性,亦即XSLT引擎的缺省输出属性,这是一个 //设置新的输出属性:输出字符编码为GB2312,这样可以支持中文字符,XSLT引擎所输出 /更新XSLT引擎的输出属性。 //调用XSLT引擎,按照输出属性中的设置,输出DOM Tree中的内容到输出介质中。 |
public static final Java.lang.String METHOD |
public static final Java.lang.String VERSION |
public static final Java.lang.String ENCODING |
public static final Java.lang.String OMIT_XML_DECLARATION |
<?XML version="1.0" standalone="yes" encoding="utf-8" ?> |
public static final Java.lang.String INDENT |
public static final Java.lang.String MEDIA_TYPE |
首先是获取XSLT引擎(Transformer类)的缺省输出属性的集合,这需要使用Transformer类的getOutputProperties()方法,返回值是一个Java.util.Properties对象。
Properties properties = transformer.getOutputProperties(); |
properties.setProperty(OutputKeys.ENCODING,"GB2312"); properties.setProperty(OutputKeys.VERSION,"4.0"); |
方法四:使用Xalan XML Serializer
方法四其实是方法三的一个变种,它需要Apache Xalan和Apache Xerces的支持才能够运行。例子代码如下所示:
//首先创建一个DOMSource对象,该构造函数的参数可以是一个Document对象 DOMSource domSource = new DOMSource (doc); //创建一个DOMResult对象,临时保存XSLT引擎的输出结果。 //下面调用JAXP中的XSLT引擎来实现输出DOM Tree中的数据到XML文件中的功能。 //设置XSLT引擎的属性(必不可少,否则会产生"汉字问题")。 //关键的一步, 调用Transformer对象 (XSLT引擎)的transform()方法,该方法的第一 //创建缺省的Xalan XML Serializer,使用它将临时存放在DOMResult对象 //设置Xalan XML Serializer的输出属性,这一步必不可少,否则也可能产生 //创建一个File对象,代表DOM Tree所包含的数据的输出介质,这是一个XML文件。 //创建文件输出流对象fos,请留意构造函数的参数。 //设置Xalan XML Serializer的输出流。 //串行化输出结果。 |
结论:
简略的讨论了Java语言编程中更新XML文档的四种方法。第一种方法是直接读写XML文件,这种方法十分繁琐,而且比较容易出错,极少使用,除非你需要开发自己的XML Parser,否则不会使用这种方法。第二种方法是使用Apache Crimson的XmlDocument类,这种方法极为简单,使用方便,如果你选用Apache Crimson作为XML解析器,那么不妨使用这种方法,不过这种方法似乎效率不高(源于效率低下的Apache Crimson),另外,高版本的JAXP或者是Java XML Pack、JWSDP不直接支持Apache Crimson,亦即这种方法不通用。第三种方法是使用JAXP的XSLT引擎(Transformer类)来输出XML文档,这种方法也许是标准的方法了,使用起来十分灵活,特别是可以自如控制输出格式,我们推荐采用这种方法。第四种方法是第三种方法的变种,采用了Xalan XML Serializer,引入了串行化操作,对于大量文档的修改/输出有优越性,可惜的是要重复设置XSLT引擎的属性和XML Serializer的输出属性,比较麻烦,而且依赖于Apache Xalan和Apache Xerces技术,通用性略显不足。
除了上面讨论的四种方法以外,实际上应用别的API(比如JDOM、Castor、XML4J、Oracle XML Parser V2)也有很多办法可以更新XML文档,限于篇幅,在这里就不一一讨论了。
责编:罗莉
课程专业名称 |
讲师 |
课时 |
查看课程 |
---|
课程专业名称 |
讲师 |
课时 |
查看课程 |
---|
点击加载更多评论>>