javascript快速入门26—XPath

    虽然现在还不能了解这些XPath表达的含意,但可以发现,它和CSS选择符十分相像!但XPath有更强大的地方,比如它可以定位到body元素下具体位置上的p或可以选择前N个p:

    1. body/p[position()<3] //将选取body子元素中前两个p元素

    XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。另外,XPath 含有超过 100 个内建的函数。这些函数用于字符串值、数值,日期和时间比较、节点和 QName 处理、序列处理、逻辑值等等。

    XPath使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径(path)或者 步(step) 来选取的。如"/"表示文档节点,"."表示当前节点,而".."则表示当前节点的父节点.示例:

    1. {因为XPath表示达式中有斜杠,所以暂时用这个表示注释!
    2. / {选取文档节点,nodeType9
    3. /root {选取文档根元素,类似于文件系统的路径(Unix),以/开头的路径都是绝对路径
    4. /root/child/.. {选取根节点root的子节点child的父节点(就是root)

    下面是一些常用路径表达式

    • nodeName 选取名称为nodeName的节点
    • / 从根节点选取
    • // 选择元素后代元素,必须在后面跟上nodeName
    • . 选取当前节点
    • .. 选取当前节点的父节点
    • @ 选取属性节点(@是attribute的缩写)
    1. {针对上面的XML文档的XPath结果,当前节点为document
    2. /root {选取root
    3. root {选取root
    4. child {空,因为child不是document的子元素
    5. //@attr {选取attr属性节点
    6. /root/child//desc {返回child的后代元素desc
    1. /root/child[3] {选取root元素的第三个child子元素,注意,这和数组下标不一样,从1开始计数
    2. //child[@attr] {选取所有具有属性attr的child元素
    3. //child[@attr="val"]/desc {选取所有属性attr的值为val的child元素的子元素desc
    4. //child[desc] {选取所有的有desc子元素的child
    5. //child[@attr>12] {XPath表达式还可以进行数值比较,该表达式将选取attr属性值大于12的child元素
    6. //child[last()] {last()函数返回节点列表最后的位置,该表达式将选取最后一个child元素

    XPath 通配符可用来选取未知的 XML 元素。

      • ,和CSS中的选择符一样,这将匹配任何元素节点
    • @* ,匹配任何属性节点
    • node() ,匹配任何类型的节点

    与CSS中使用逗号组合使用多个选择符一样,XPath支持一种使用"|"来组合多个路径的语法!

    1. //child | //desc {选取所有的child元素与desc元素

    下面列出了可用在 XPath 表达式中的运算符:

    • | ,计算两个节点集
      • ,加法
      • ,减法
      • ,乘法
    • div ,除法,因为/已经被作为路径符了,所以不能用来作为除法标识
    • mod ,取余
    • = ,等于
    • != ,不等于
    • < ,小于
    • <= ,小于或等于
    • > ,大于
    • >= ,大于或等于
    • or ,或
    • and ,与

    轴可定义某个相对于当前节点的节点集。下面一可用的轴名称与对应的结果:

    • ancestor 选取当前节点的所有先辈(父、祖父等)
    • ancestor-or-self 选取当前节点的所有先辈(父、祖父等)以及当前节点本身
    • attribute 选取当前节点的所有属性
    • child 选取当前节点的所有子元素。
    • descendant 选取当前节点的所有后代元素(子、孙等)。
    • descendant-or-self 选取当前节点的所有后代元素(子、孙等)以及当前节点本身。
    • namespace 选取当前节点的所有命名空间节点
    • parent 选取当前节点的父节点。
    • preceding 选取文档中当前节点的开始标签之前的所有节点。
    • preceding-sibling 选取当前节点之前的所有同级节点。
    • self 选取当前节点。
      事实上,一个完整的XPath表达式由"/"与"步"构成的,而步又是由 "轴" 、 "节点测试"和"谓语"构成的.如下:
    1. step/step/..... {一个XPath表达式
    2. {step的构成
    3. 轴名称::节点测试[谓语]
    • child::abc ——————————- abc(子元素abc)
    • root/attribute::id —————— root/@id(root的属性id)
    • selft::node() ————————— .(自身)
    • parent::node() ———————- ..(父节点)
    • child:: ———————————— (子元素)
    • child::text() ————————— text()(子文本节点)
    • descendant::tag —————— .//tag (后代tag元素)
      XPath还包含一套函数库,如position与last就是函数,一般的函数被用在谓语中,而在XSLT及XQuery中它们则得到了更广泛的使用.

    IE浏览器对XPath的实现比较简单.一个XML DOM对象(及每个节点)都有selectSingleNode与selectNodes方法,传入XPath表达式,selectNodes返回匹配的节点列表,而selectSingleNode则只返回列表中第一个项目!

    Mozilla是根据DOM标准来实现对XPath的支持的。DOM Level 3附加标准DOM Level 3 XPath定义了用于在DOM中计算XPath表达式的接口。遗憾的是,这个标准要比微软直观的方式复杂得多。

    虽然有好多与XPath相关的对象,最重要的两个是:XPathEvaluator和XPathResult。XPathEvaluator利用方法evaluate()计算XPath表达式。

    evaluate()方法有五个参数:XPath表达式、上下文节点、命名空间解释程序和返回的结果的类型,同时,在XPathResult中存放结果(通常为null)。

    • XPathResult.ANY_TYPE——返回符合XPath表达式类型的数据
    • XPathResult.ANY_UNORDERED_NODE_TYPE——返回匹配节点的节点集合,但顺序可能与文档中的节点的顺序不匹配
    • XPathResult.BOOLEAN_TYPE——返回布尔值
    • XPathResult.FIRST_ORDERED_NODE_TYPE——返回只包含一个节点的节点集合,且这个节点是在文档中第一个匹配的节点
    • XPathResult.NUMBER_TYPE——返回数字值
    • XPathResult.ORDERED_NODE_ITERATOR_TYPE——返回匹配节点的节点集合,顺序为节点在文档中出现的顺序。这是最常用到的结果类型
    • XPathResult.ORDERED_NODE_SNAPSHOT_TYPE——返回节点集合快照,在文档外捕获节点,这样将来对文档的任何修改都不会影响这个节点列表。节点集合中的节点与它们出现在文档中的顺序一样
    • XPathResult.STRING_TYPE——返回字符串值
    • XPathResult.UNORDERED_NODE_ITERATOR_TYPE——返回匹配节点的节点集合,不过顺序可能不会按照节点在文档中出现的顺序排列
    • XPathResult.UNORDERED_NODE_SNAPSHOT_TYPE——返回节点集合快照,在文档外捕获节点,这样将来对文档的任何修改都不会影响这个节点列表。节点集合中的节点和文档中原来的顺序不一定一样。
      下面是使用ORDERED_NODE_ITERATOR_TYPE的例子:
    1. var xmlDom = getXMLDOM();//我们之前写的跨浏览器的XML DOM加载函数
    2. loadXMLFile(xmlDom,"text.xml"); var evaluator = new XPathEvaluator(); var result =evaluator.evaluate("/root",xmlDom,null,XPathResult.ORDERED_NODE_ITERATOR_TYPE,null); var node; if (result) {//执行失败会返回null
    3. while(node=result.iterateNext()) {//这个列表必须使用iterateNext方法遍历
    4. alert(node.tagName);
    5. }