历数Firefox2.0对XML处理的改进
Firefox 2.0 在对 XML 的支持方面有几个重要的改进。目前它的用户部署如日中天。了解 Firefox 2.0 XML 特性的改进,包括在 RSS Web 提要处理方面有争议的变化。
被赋予新应用程序平台的角色后,现在 Web 浏览器可能是最热门的软件。对于软件开发人员来说这是令人激动的时刻,动态 HTML 技术以 Asynchronous JavaScript XML (Ajax) 获得重生,Microsoft® Internet Explorer® 的开发得以恢复等等。过去两年中,关于 XML 和 Firefox 的 developerWorks 系列文章(请参阅 参考资料)介绍了以 1.8 版本的核心 Mozilla 浏览器引擎为基础的 Firefox 1.5 版。此后,Mozilla 项目永不停歇的开发步伐又催生了 Firefox 2.0,它以 Gecko 1.8.1 Web 呈现引擎为基础。Firefox 2.0 的一些改进涉及到 XML 处理。本文介绍了最新的 Firefox XML 处理功能,包括开发人员应该记住的可能遇到的主要障碍。
减少了对 Web 提要的控制
Firefox 2.0 一个变化引起了用户社区的极大惊慌。如果提供 RSS 或 Atom 这类 Web 提要,可能需要包括 XSLT 样式表为用户转换成其他表示形式。清单 1 中的 Atom 提要引用了这样的转换。
清单 1. 包含样式表引用的 Atom 提要
<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/xml" href="atom2html.xslt"?>
xml:base="http://www.example.org">
关键是第二行中的样式表处理指令(PI)。如果用 Firefox 1.5 打开,浏览器就会尽职尽责地加载 atom2html.xslt 并显示结果。本系列文章第 2 部分(请参阅 参考资料)已经提到,查看实际的 XML 必须通过 “查看源代码”。在 Firefox 2.0 中,浏览器忽略该样式表 PI 并使用定制的 Firefox 视图查看,如图 1 所示(Firefox 2.0.0.6、Mac OS X 平台上的屏幕截图)。
图 1. Firefox 2.0 内置的 Web 提要视图
避免这种情况并强制使用所选样式表,惟一的办法就是愚弄头脑简单的 Firefox,它通过在文件前 512 个字节中查找 “rss” 或 “feed” 来判定是否为 Web 提要。清单 2 采用了一种广为人知的办法,专门插入一段注释来填充这 512 个字节。
清单 2. 绕过 Firefox 2.0 和 Internet Explorer 7 默认样式表处理方式的 Atom 提要
<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/xml" href="atom2html.xslt"?>
xml:base="http://www.example.org">
考虑了用户社区的反对意见之后,Firefox 开发人员决定坚持自身的立场,因而这种行为方式将保留到未来的 Firefox 版本之中。我个人不喜欢这种方式,您可以阅读有关的争论再决定喜欢与否。值得一提的是,这种做法与 Internet Explorer 和 Apple Safari 有相似之处。
微摘要
微摘要(microsummarie),也称为活动标题(Live Title)是 Firefox 2.0 一种简洁的新特性,可以让浏览器用网站中一些有意义的内容来替换标题,特别是在书签中。比如,IBM developerWorks 的微摘要可以用站点上的最新文章标题代替静态文字 “developerWorks : IBM's resource for developers”。网站可以提供一个微摘要,用户也可自行创建。后一种情况称为 “微摘要生成器”,也是本文更关注的一点,因为它要求用户端处理 XML 和 XSLT(不熟悉 XML 的人可以重复使用其他人提供的生成器)。清单 3 中的微摘要生成器提取 developerWorks 主打文章的标题。
清单 3. 使用 IBM developerWorks 主打文章标题的微摘要生成器
<?xml version="1.0" encoding="UTF-8"?>
生成器包括两部分:模板和页面信息。模板包括应用于网页的提取微摘要文本的 XSLT 代码。后者指定浏览器把微摘要应用于哪个页面。微摘要是简单的文本,输出指令与此相适应。微摘要的关键在于 XPath //html:a[@class='feature'][1],查找包含主打文章标题的元素。pages 部分的正则表达式保证微摘要可用于网站首页和每个 developerWorks 专区的首页。
参考资料 提供的一篇教程说明了如何安装 清单 3 这样的微摘要生成器。到目前为止,微摘要还是 Mozilla 特有的特性。
SAX 及其他
对于那些开发 Mozilla 扩展的人来说,最有意义的是 Mozilla XPCOM 组件系统现在提供了一个 SAX 解析器框架。如果没有合适的高层处理技术,可以自行开发高效处理 XML 的扩展。XPCOM 集成意味着可以用 C 、JavaScript 或具有 XPCOM 绑定支持的其他任何语言来处理 SAX 事件。
OpenSearch
OpenSearch 是 Amazon A9 孵化器开发的一个 XML 标准。它提供了几种 XML 格式和其他约定来描述和使用搜索引擎。Firefox 一直强力支持可扩展的搜索引擎插件,2.0 引入了 OpenSearch 支持,因而可以通过与 Iternet Explorer 及其他浏览器兼容的机制扩展搜索功能。
Firefox 支持的 OpenSearch 1.1 目前是 beta 版,为保持与 Firefox 和 OpenSearch 的兼容性,可能需要更新。清单 4 提供了对于 IBM developerWorks 的 OpenSearch 描述文档。
清单 4. IBM developerWorks 的 OpenSearch 描述文档
<?xml version="1.0" encoding="UTF-8"?>
libraryview.jsp?
search_by={searchTerms}"/>
该文档仅仅说明 IBM developerWorks 提供了一个搜索 URL:
http://www.ibm.com/developerworks/views/xml/libraryview.jsp?search_by={searchTerms}
其中的 {searchTerms} 是一个模板参数,搜索工具将使用搜索项目来代替它。如果搜索 “Firefox XML”,URL 将变成:
http://www.ibm.com/developerworks/views/xml/libraryview.jsp?search_by=Firefox XML
OpenSearch 规范了定义了这种 URL 模板系统。OpenSearch 还定义了把结果返回为 RSS 2.0 或 Atom 1.0 提要的约定和几种专用的扩展。Firefox 还不支持这种 Web 提要搜索结果,如果描述不含 Url 元素和 type="text/html"(表示从 URL 返回的内容类型)则返回错误。这种限制很不合理,但也可能是基于多数人仍然通过传统 HTML 表单和结果页面而不是 Web 2.0 机制搜索的现实考量。
在 Firefox 2.0 中,清单 4 这样的 OpenSearch 描述就像是完整的搜索引擎插件。网站可以使用页面头部的链接指定这样的描述,比如:
title="IBM developerWorks"
href="/path/to/opensearch/description/document.xml"/>
注意:前面的三行代码通常显示为一行。为了便于显示和打印而分解成多行。
结束语
仍在 alpha 测试阶段的 Firefox 3.0 将带来更重要的 XML 特性。预计将在 2008 年上半年发布完整的版本。包括关于 XML 处理的重要 bug 修正和新的特性,当它成为主流 Firefox 版本的时候我将继续讨论。Mozilla 核心 XML 工具箱仍然在不断改进,对于涉及 XML 技术的开发人员和用户来说是一大福音。对于多数用户和开发人员来说,Web 浏览器是 XML 处理的脸面,本系列文章讲继续追踪和讨论最新 Firefox 版本的相关特性。
参考资料 您可以参阅本文在 developerWorks 全球网站上的 英文原文。 Updated developer features for Firefox 2.0:查看 Firefox 2.0 的新特性,其中部分涉及到 XML。 Updated developer features for Firefox 3.0:跟踪 Firefox 下一版本的变化和新功能,包括和 XML 有关的新特性。 XML in Firefox 1.5:阅读这三篇最新的 developerWorks 系列文章: Firefox 1.5 中的 XML,第 1 部分: XML 特性概述(Uche Ogbuji,2006 年 3 月):了解这一迅速发展的 Web 浏览器的 XML 新特性。 Firefox 1.5 中的 XML,第 2 部分: 基本 XML 处理(Uche Ogbuji,2006 年 3 月):Firefox 中的基本 XML 处理,包括 XML 解析、级联样式表(CSS)和 XSLT 样式表。还需要了解一些限制。 XML in Firefox 1.5, Part 3: JavaScript meets XML in Firefox(Uche Ogbuji,2006 年 8 月):使用 JavaScript 在 Firefox 浏览器中操作 XML。 Controversial new Firefox 2.0 change:关于 Firefox 忽略很多 XML Web 提要中所提供样式表链接的讨论。 Microsummaries:了解这种 Firefox 2.0 新增的网页自动更新摘要。 SAX support in Firefox 2.0:了解如何使用 Simple API for XML (SAX) 解析 API 和 XUL 应用程序及扩展。 SVG in Firefox 2.0:了解 Firefox 2.0 对 SVG 的支持。 Creating OpenSearch plugins for Firefox:创建与 OpenSearch 兼容的支持 Firefox 专有特性的搜索插件,如搜索提示和
SearchForm
元素。
Introducing OpenSearch (Uche Ogbuji,O'Reilly xml.com,2007 年 7 月):了解 OpenSearch,共享搜索结果的一组简单格式。
developerWorks search help:高效的搜索策略,了解如何输入搜索查询和使用 IBM developerWorks 运算符。
IBM XML 认证:看看如何才能成为一名 IBM 认证的 XML 及相关技术的开发人员。
XML 技术文档库:developerWorks XML 专区提供了大量技术文章和技巧、教程、标准以及 IBM 红皮书。
developerWorks 技术事件和网络广播:随时关注技术的最新进展。
技术书店:关于本文主题和其他技术主题的书籍。
获得产品和技术
Firefox:基于 Mozilla 的 Web 浏览器提供了符合标准、高效安全和强大的 XML 特性。当前版本是 2.0.0.6。 IBM 试用版软件:用这些试用版软件开发您的下一个项目,可直接从 developerWorks 下载。
关于作者
Uche Ogbuji 是 Zepheira, LLC 的合伙人,这家公司专门提供下一代 Web 技术解决方案。Ogbuji 是 4Suite 的首席开发人员,这是一种用于 XML、RDF 和知识管理应用程序的开放源代码平台;也是 Versa RDF 查询语言的首席开发人员。他是一位出生在尼日利亚的计算机工程师和技术作家,目前定居在科罗拉多的博尔德。可以通过他的 Weblog Copia 进一步了解 Ogbuji 先生。
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
本文地址:/web/XML/77513.html