• 4.83 MB
  • 2022-04-22 13:32:20 发布

GBZ19669.2-2005XML在电子政务中的应用指南.pdf

  • 50页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'免费标准下载网(www.freebz.net)GB/Z19669-20053查询出了所有分指标多于三个的统计指标。XQuery还包含一些用来访问文档资源库中多个文档的机制,允许用户以编程方式在同一个查询中访问多个文档。XQuery最适合处理“混合”文档,即同时包含叙述文字和量化数据的文档。这种文档不适合存储在关系型数据库中,但是,XQuery却非常擅长此道,它能直接从该XML文档中抽取出量化信息。XQuery并不是适合所有地方。尽管依照句法来说,它在数据操作上比XSL要好用得多,特别是它支持许多XSL不直接支持的操作,但是其底层的引擎还是要必须读取每篇文档,并解析它,然后使用查询语言对它操作。因此,对于已建立索引的文档资源库(即纯XML数据库),XQuery是快速访问文档具体内容的好的解决方案,但是对于未建立索引的文档,它不一定是一个好的解决方案,特别是对于文档的一般简单数据查询,还是可以用XSTL加XPath来实现。而且,如果文档是纯数据,那么将该文档引入到关系型数据库中,使用SQL进行数据查询操作将会更方便。在纯XML数据库中获取数据可以以数据信息的原始XML格式获取它,不需要附加任何的编码。同时我们还可以通过样式控制,使数据以一定的样式显示。要从大量文档信息中获取一小段数据,不同的纯XML数据库平台可能会有不同的实现方式。一些纯XML数据库平台在获取一段数据时,需要从数据库返回整个文档;另一些则在将XML文档保存到资源库之前将它们分解,这在数据获取的性能上比前一种情况有所改善,但是它不适合文档结构很复杂的情况。5.2.1.3.4数据连接为了使数据结合的更紧凑,可以在XML文档中使用类似HTML中的超链接方式,将不同的XMI.数据集或者一个XML数据集中的不同部分连接起来。比如,同一个文档要被不同的用户访问,而这些用户可能想以不同的方法使用它;再如,领导可能只对统计或总体数据感兴趣,对具体的独立行项的详细信息却不需要,而具体业务人员可能需要获取更详尽的数据细节。理想的做法是仅传送带有指向更详细信息链接的文档的基本框架。XML数据连接提供了完成该任务的出色方法,同时还避免了重复的细节信息对大量磁盘空间的浪费。XML数据连接可以通过XLink和XPoint来实现,其中XLink实现文档之间的相互连接,XPointer实现文档内部不同部分之间的连接。a)文档间连接文档间的连接可以分为简单链接和扩展链接,通过x1ink:type属性来区分,或分别使用<xlink:simple/>和<xlink:extended/>元素。简单链接与HTML中的超链接相似,是单向连接,即只从源文档指向目标文档,以单方向链接两个位置。链接的触发时机可以通过xlink:actuate属性指定,既可以在加载文档时自动激活,也可以在用户采取特定操作(如点击)时触发。扩展链接允许把多个资源链接在一起,可以实现双向连接,即链接所处的文档不一定是源。扩展连接使用<x1ink:locator/>子元素来指定参与链接的每个文档的定位,使用814151617181920212223284150567U2VhcmNoIFJ1cXV1c3QgRXhhbXBsZQ二=89101112TWljcm9zb2ZOIEFjdGl2ZSBEaXJIY3Rvcnk=131415john16得到的应答是在查询反馈23person4Johnson5David6ProgramManager789top10person11organizationalPerson12Smith1314151617U2VhcmNolFJlcXVlc3QgRXhhbXBsZQ==18192021225.3应用层5.3.1公文处理5.3.1.1典型应用场景公文处理是指公文的办理、管理、整理(立卷)、归档等一系列相关联、衔接有序的工作。典型应用场免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)cs/z19669-2005景如下:场景I:发文处理某部委一业务司要向其下级机关发一通知,处理过程如下:a)该业务司业务负责人员参照“通知”类公文模版起草通知;b)起草完后,交本司主管负责人审核,审核后返回起草人,由起草人根据审核意见进行修改后,重新交本司主管领导审核,此过程可能反复多次;c)本司主管领导审核通过后,交文秘处进行审核,检查行文方式是否妥当,是否符合行文规则和拟制公文的有关要求,公文格式是否符合规定;d)审核通过后,交业务司主管负责人签发;e)签发后交秘书处复核,检查审批、签发手续是否完备,附加材料是否齐全,格式是否统一、规范等;f)复核无误后,返回业务司,业务司交收发室;g)收发室对发文进行编号、登记,然后印发、交档案室归档;h)归档后的发文相关业务人员只能查看。场景2:收文处理某部委收发室收到上级机关的办文,处理过程如下:a)收发室办理登记后,交秘书处。b)秘书处对收文内容进行审核,审核是否应由本机关办理;是否符合行文规则;内容是否符合国家法律、法规及其他有关规定;涉及其他部门或地区职权的事项是否已协商、会签;文种使用、公文格式是否规范等。c)经审核,对符合规定的公文,秘书处提出拟办意见,送主管负责人批示后,交有关部门办理,需要两个以上部门办理的要明确主办部门。对紧急公文,明确办理时限。对不符合本办法规定的公文,经办公厅(室)负责人批准后,可以退回呈报单位并说明理由。d)承办部门收到交办的公文后,紧急公文按时限要求办理,确有困难的,应当及时予以说明。对不属于本单位职权范围或者不宜由本单位办理的,应当及时退回交办的文秘部门并说明理由。e)公文办理中遇有涉及其他部门职权的事项,主办部门应当主动与有关部门协商;如有分歧,主办部门负责人要出面协调,如仍不能取得一致,可以报请上级机关协调或裁定。f)承办部门要将办理结果对主管负责人通报。9)送负责人批示或者交有关部门办理的公文,文秘部门负责催办,紧急公文跟踪催办,重要公文重点催办,一般公文定期催办。5.3.1.2应用需求分析公文处理业务需求可以概括为以下几个方面:a)对各种格式的公文(结构化、文档化)进行有效表示与存储;b)在不同部门之间进行授权的公文交换;c)不同业务人员对公文的不同部分具有不同的处理权限;d)方便、快捷地进行公文信息的搜索和统计。5.3.1.3技术方案5.3.1.3.1公文数据元表示公文数据元的表示可以利用DTD或者Schema对数据元的名称、定义、ID、数据类型、值域、所有者、版本等属性进行定义和描述。通过XML命名空间解决命名冲突问题。采用的方法是两段式命名法,其中第一段是代表特定命名空间的命名空间前缀,第二段是元素或属性原来的名字,两段之间用冒号分开。为保证数据元命名的唯一性,可以将数据元分类,把同一类型的数据元集中在一起,使用共同的命名空间。不同分类的数据免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/z19669-2605元元素由于有了不同的命名空间的前缀,即使元素或属性有相同的命名也不用担心命名冲突。XML命名空间的定义由命名空间的声明、合法名称的定义及应用、命名空间的作用域三部分组成。5.3.1.3.1.1XML命名空间的声明XML命名空间的声明是通过保留属性”xmlns”来实现的。示例:1<内容:内容xmlns:内容=http://www.xml,net.cn/内容2xmlns:格式=http.//www.xml.net,en/格式>命名空间声明有两种方式,即直接定义方式和缺省定义方式:a)直接定义方式:xmlns:仁命名空间前缀〕=[命名空间名」;b)缺省定义方式:xmlns=「命名空间名〕。在电子政务公文的数据元应用中,可以按公文的不同属性划分命名空间,如公文内容、公文格式以及公文流转属性等等。合法名称的定义和应用:在定义了命名空间的声明以后,对如何引用命名空间前缀构成新的元素名和属性名,需要再作进一步的统一规范,这就是所谓合法名称定义的由来。合法名称由用冒号分开的前缀部分和本地部分组成,其中前缀部分和本地部分都是一个合法的XML名称,如“内容:标题”。合法名称的前缀部分,规定必须是一个命名空间前缀,且这个命名空间前缀必须已经经过命名空间声明,语法分析器会自动将其与声明中的URI引用相联系。冒号后的部分是该命名空间中定义的元素或属性名,提供了合法名称的本地部分。在用缺省方式声明命名空间时,由于命名空间前缀为空,因此,这时的合法名称只剩下本地部分。如下所示:示例:1<?xmlversion="1.0"encoding二”GB2312"?>2<内容xmlns=http://www.xml.net.cn/内容3xmlns:格式=http://www.xml.net.cn/格式>4<标题>关于XX的决定</标题>5<正文>据国务院第XX号文</正文>6<格式>7<格式:字体>8<格式:标题>黑体</格式:标题>9<格式:正文>宋体</格式:正文>10</格式:字体>11</格式>12</内容>合法名称的应用主要有三种情况:a)用于起始元素标记、结束元素标记和空元素标记。如前面例子所示;b)用于属性的定义;c)用于DTD中的元素名和属性类型。5.3.1.3.1.2命名空间的作用域所谓命名空间的作用域是指,一个命名空间声明可以作用到哪些元素和属性。一般认为命名空间声明,能够作用到说明它的元素和该元素的所有内容元素,除非被其他命名空间声明所覆盖。如下所示:示例:1<?xmlversion="1.0"encoding="GB2312"?>2<内容xmlns=http://www.xml.net.cn/内容>3<标题>关于XX的决定</标题>免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/Z19669-20054<正文>据国务院第xx号文</正文>5<格式>6<格式:字体xmlns:格式二http://www.xml,net.cn/格式>7<格式:标题>黑体</格式:标题>8<格式:正文>宋体</格式:正文>9</格式:字体>10</格式>n</内容>缺省命名空间“http://www.xml.net.en/内容”的作用域在<字体>元素以外的地方,而“http刀www.xml.net.cn/格式”命名空间的作用域在<字体>元素内,包括<字体>元素本身。5.3.1.3.2公文内容要素的表示5.3.1.3.2.1公文静态和动态要素公文具有一个显著的特点就是规范性,无论从内容的构成、表现的格式还是流转的流程来说都有一定的固定模式。公文内容一般由秘密等级和保密期限、紧急程度、发文机关标识、发文字号、签发人、标题、主送机关、正文、附件说明、成文日期、印章、附注、附件、主题词、抄送机关、印发机关和印发日期等部分组成。每一个部分可以作为公文的子元素,并详细定义其中的一些属性。前面提到的公文元素均为一些静态元素,公文还存在一些和流转有关的属性,可称为动态元素。可以包括流转序号、关联流转序号、送出时间、签收时间、公文状态、办理单位、办理人职务、办理人名称、办理意见、办理时间等。通过对公文动态元素的规范可以把公文的流转标准化。建议公文的文档定义采用外部的DTD文档,并可用Publi。关键字修饰,这样可以保证多个XML文档共享定义完成的DTD文档。DTD作为XMLL0规范的重要组成部分,对XML文档的结构起到了很好的描述作用。但是DTD也有其显著的弱点,比如,它采用了非XMI.的语法规则、不支持数据类型、扩展性较差等等。而Schema避免了这方面的问题,所以我们推荐使用Schema来对文档结构进行描述。Schema具有以下优点:a)一致性:Schema使得对XMI、文档的定义不必再使用一种特定的形式化的语言,可以直接借助XMI.自身的特性,利用XML的基本语法规则来定义XMI,文档的结构,使得XMI.达到了从内到外的完美统一,也为XMI,的进一步发展奠定了坚实的基础;b)扩展性:Schema对DTD进行了扩充,引入了数据类型、命名空间,从而使其具备较强的可扩展性;c)互换性:利用Schema,我们能够书写XML文档以及验证文档的合法性。另外,通过特定的映射机制,还可以将不同的Schema进行转换,以实现更高层次的数据交换;d)规范性:同DTI)一样,Schema也提供了一套完整的机制以约束XMI.文档中置标的使用,但相比之下,后者基于XML,更具有规范性。Schema利用元素的内容和属性来定义XML文档的整体结构,如哪些元素可以出现在文档中、元素间的关系是什么、每个元素有哪些内容和属性、以及元素出现的顺序和次数等等。DTD公文内容表示示例:示例1:1<!ELEMENT公文(公文头、公文体)>2<!ELEMENT公文头(秘密等级、发文字号、主送机关、抄送机关、印发日期)>3<!ELEMENT秘密等级(#PCDAT八)>4<!ELEMENT发文字号(#PCDATA)>5<!ELEMENT主送机关(#PCDATA)>6<!ELEMENT抄送机关(#PCDATA)>免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/Z19669-20057<!ELEMENT印发日期(#PCDATA)>8<!ELEMENT公文体(签发人、标题、正文、印章、附件、主题词)>9<!ELEMENT签发人(#PCDATA)>10<!ELEMENT标题(并PCDATA)>11<!ELEMENT正文(井PCDATA)>12<!ELEMENT印章(#PCDATA)>13<!ELEMENT附件(#PCDATA)>14<!ELEMENT主题词(#PCDATA)>Schema公文内容表示示例:示例2:1<?xmlversion二”1.0"encoding="GB2312"?>23212229325.3.1.3.2.2公文交换与形式定制公文交换包括公文在不同业务机构间传递授权信息,并以各机构需要的形式进行显示。XML在公文交换中的应用有:a)公文信息的过滤,对非授权人员,屏蔽有关的信息。b)信息的多样化访问形式。免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/Z19669-2005可以通过使用XPath与XSTL相结合,来实现XML数据转换、数据屏蔽和不同的访问形式。XPath维持了原始文档的层次性和结构,适用于访问XML文档中的独立节点。XSLT则适用于对结果进行处理,包括构建新的元素。因此,XPath与XSTL相结合将允许开发者对数据信息进行自由的操作和重组,并屏蔽非授权的业务信息。通过CSS和XSLT可以实现相同的文档不同的呈现形式。CSS和XSLT不同,CSS不是基于XML标准格式的,是一种静态的样式描述格式,其本身不遵从XML的语法规范。而XSLT本身就是一个XML文档,系统可以使用同一个XML解释器对XML文档及其相关的XSLT文档进行解释处理。有关XSLT的例子:示例:1<?xmlversion="1.0"encoding="gb2312"?>25679101114151617</BODY>18192021222324252627282930313233343536免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/Z19669-200537将该例和一个简单的XML文档与它的DTD描述结合起来,表现如下:XML文档:示例:1<?xmlversion="1.0"encoding二”g62312"?>2<?xml-stylesheettype="text/css"href="mystyle.xsl"?>3公文管理表:示例:1232002.9.55672002.9.249<八nformation>DTD描述:示例:1<!ELEMENTinformation(document,)>2<!ELEMENTcustomer(name+,date,send)>3<!ELEMENTname(#PCDATA)>4<!ELEMENTdata(#PCDATA)>5<!ELEMENTsend(#PCDATA)>表现效果:见表50表5公文管理表)4})-T}xxxM1AO仁拳一itA10洲5.3.1.3.2.3公文处理流程控制XML在公文处理流程控制中的应用包括处理流程的定义、业务流程的执行监控、流程分析等。公文流程控制中XML的应用见5.2.35.3.1.3.2.4公文检索XMI.在公文检索中的应用包括公文的查询、公文内部特定信息的定位与搜索等。在电子公文流转和电子公文传递过程中会用到资源定位的技术。例如:一篇公文可能会引用涉及其他行业的一些外部资源,由于这些资源是跨行业的,对行政机关单位而言,很有可能是远程的;另外,起草一般的非法定性公文时,有可能会使用到法定公文中定义的一些资源,这些资源可能是需要被定位的本地资源。公文处理中此类情况的处理,可运用XMI.的资源定位技术XLink,XPointer。其中,XLink语言用于建立资源之间的链接;XPointer用于定位XML文档中的片断。示例:1<!ELEMENTSimpleLink(井PCDATA)>2<!ATTLISTSimpleLink免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/Z19669-20053xmlns:xlinkCDATA#FIXED"http://www.w3.org/1999/xlink"4Aink:type(simple)#FIXED"simple"5xlink:hrefCDATA#REQUIRED6x1ink:roleCDATA#IMPLIED7x1ink:titleCDATA#IMPLIED8xlink:show(embed}replace}new)"replace"9xlink:actuate(onLoad}onRequest)"onRequest">利用这个元素声明,可以定义如下实例:示例:IThisisasimplexlink!4XPointer语言的主要功能是在XML文件中定位片段(fragment),在XML链接中,通常将它加到URL的结尾,更明确地表示目标资源。但是XPointer语言的使用并不局限于XML链接,它可以用在需要文档内部定位的任何地方,比如在可视化的XML编辑器中用于描述用户选择的节点或字符串。XPointer语言基于XSLT中的XPath,它支持在XML文件中定位元素、属性、字符串等内部结构。与XPath语言一样,XPointer语言中的表达式是多个位置步形成的一个位置路径,每个位置步间用“/”分隔,前面位置步的运算结果构成后面位置步的上下文节点。位置步的形式为axis::node-test巨predi-ates],它包括三个部分:a)关键字,有且仅有一个,它表示结果节点与上下文节点的关系;b)节点测试,有且仅有一个,它表示结果节点的类型或名称;c)谓词,零到多个,它可以是用于限制结果的任意表达式。5.3.2业务处理5.3.2.1典型应用场景在5.2.1典型应用场景中,曾以统计局统计调查项目数据、综合进度数据和宏观经济指标数据的访问为例。本应用场景是统计调查项目设计与管理的业务处理过程。统计调查项目设计与管理的业务处理如下:a)申请:拟新建或修改统计调查项目管理数据库内容的单位,在线填写新建或修改申请登记表,提交统计设计管理司;b)审查:统计设计管理司对登记表进行审查,并将审查结果反馈申请单位;c)设计:有关单位利用在线工作界面新建或修改统计调查项目内容。设计完成后提交统计设计管理司;d)审批:统计设计管理司对统计调查项目的设计内容逐项进行审核。对于经审核通过的统计调查制度、统计报表、统计分类标准和统计法规性文件,需上报主管领导审定。主管领导审批签发后,由统计设计管理司编制表号,办公室编制文号;e)存储:统计设计管理司将审批签发的统计调查项目内容归档人库,并进行备份;f)发布:统计设计管理司根据密级要求,发布已建立或修改的统计调查项目内容;g)印发:设计或实施单位印刷和发送统计调查项目内容。5.3.2.2应用需求分析在上述典型的业务处理应用场景中,应用的需求可以概括为:a)业务处理模型定义:统计调查项目设计与管理的业务处理通过申请、审查、设计、审批、存储、发布和印刷等过程完成具体的执行。通过对宏观处理模型的定义,规范业务的处理流程和相关信息的生成、传递与操纵;免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/Z19669-2005b)业务执行过程中相关业务信息的生成、传递和操纵:在业务的具体执行过程中,每一处理过程有两种情况:一种情况是生成业务数据(例如,在线填写申请登记表),另一种情况是接收前面业务过程的处理结果,并在本过程中对其进一步处理,同时生成新的业务信息(例如,审查在线填写提交的登记表)。业务处理应能对数据的生成、传递和操纵提供有效的表示机制;。)业务操作的具体执行:在每一业务处理阶段,各项业务处理过程均是由一个个具体的业务操作组成,业务操作的具体执行完成本阶段的业务处理功能。业务处理系统应能对微观业务操作提供表述方法,规范其执行方式;d)相关业务执行过程的触发:通过宏观的业务处理模型定义、微观的业务操作表述以及相关业务信息的有效表示,定义和规范各个层次的业务协作机制。5.3.2.3技术方案a)业务处理模型定义在XML标准中,涉及到业务处理模型的定义的有:BPMI,,WPDI_,XPDL,ebXMI,BPSS,WSFL,XLANG,BPEL4WS和WSCI等。b)交互信息与业务流信息的传送将人机交互信息与业务流信息格式化为XMI_文档,采用消息系统、FTP或SMTP的形式向目标系统传送。这样使数据的定义独立于特定编程语言,同时可以利用XPath来定义转移条件中需要使用的条件表达式。因为XPath可以直接访问XML文档的数据,并能够描述表达式,表达式中还可以加用namespace修饰的(namespace-qualified)函数。各种基于XML的工作流建模标准都有有关流程数据的定义。例如:在BPEL4WS中,流程被存放在。ontainer中,在同一个Context中的活动可以访问到container中的数据。在工作流模型中甚至定义向container存取数据的操作(assign)o使用WSDI,描述应用系统接口,简化工作流系统与外界操作、管理、监控、互操作系统的接口定义工作。WSDL描述的分布式WebServices已经得到广泛支持,使用任何语言或平台开发的应用组件都可以通过WebServices接口方便地接人到工作流系统中来。而且,由于WebServices是分布式系统的服务访问接口,各种应用组件以及BPMS可以分布到不同的(甚至是相隔遥远的)机器上。通过基于WSDI,和XMLSchema的数据描述,业务系统可以定义出通用于各种系统的统一数据格式。而且,基于XML的SOAP或XMLP的信息传输机制独立于各种特定的消息系统(HTTP,SMTP,FTP、消息中间件等等),可用于构建统一的数据传输渠道。采用集成了WSDL访问接口、XML数据描述功能的BPEL可以简化从工作流模型到BPMS操作模型的转换工作。c)业务过程的触发与协作可以采用XML模型语言(例如ebXMI,,BPEI,4WS)描述互操作模型,用WSDL描述服务接口,用UDDI登记和查找需要的企业服务,用SOAP或SOAPwithAttachment传输数据。ebXML是专门针对系统间互操作而开发的XML协议集合,其中BPSS可以定义对外工作流模型(BPSS使用了UML中的语法元素),CPP/CPA可以定义参与、各方的合作协议,Registry/Repository用于登记合作企业(或机构)的信息(如服务接口、CPP等),ebXMLMes-sagingService(建立在SOAP基础之上)可用于可靠的信息传输。在ebXMLBPSS中定义了两种互操作(或称为协作)模式:1)双边协作(BinaryCollaboration)。这是两个系统之间的交互流程,由一系列交互事务组成,而且定义了各方在每个事务中的角色。2)多边协作(MultipartyCollaboration)。这是多个系统之间的交互流程。多边协作被分解为一组双边协作来表达,因此交互事务和双边协作是BPSS中可重用的流程组件。下面是一段BPSS的协作流程定义示例:免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/Z19669-2005示例:126781113202122232526273237384244从第1行至第22行中定义了一个交互事务“CreateRequestTable"。在该事务中,请求方发送一个“RequestTable”文档,而接收方要回应一个“POAcknowledgement”文档,并在其中免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)Gs/z19669-2005附上“DeliveryNotes"。这个事务描述了发送申请登记表的过程。从第23行至第44行定义了一个双边协作流程。首先定义双方的角色“requestor”和“ac-knowledger";然后引用两个交互事务“CreateRequestTable"和“Notifyacknowledgement(未出现在该示例中)’作为协作流程的具体活动,同时指定了在每个事务中,哪个角色是“request-or",哪个角色是“acknowledger";最后定义了各交互事务之间的转移关系:首先从“CreateRe-questTable"开始,然后执行“Notifyshipment",如果“Notifyshipment"返回成功信息,则表示流程成功结束。5.3.3倍息发布5.3.3.1典型应用场景电子政务中信息发布方式大致经历了这样几个阶段:第一阶段是网络建设及接人,简单的信息发布;第二阶段是建设基于数据库的内部、外部信息平台和信息发布机制,使上网的政府机构实现电子化办公,并能通过网络发布更多的实时信息,例如国家法律法规、各种规章制度,国家机构办事手续等。同时建立信息收集和反馈机制,以便政府机关方便地通过网络得到相关企事业或国家机关的信息,从普通用户获得反馈意见,更好地提高工作效率。第三阶段是政府机关最终通过网络实现无纸办公,不同政府机关之间通过网络交换信息、下达文件和指示,政府机构网上电子办公和电子商务等将融为一体,从而实现网上交互式办公、各部门资源共享和协同工作、一般用户可通过网络办理公务等。5.3.3.2应用摇求分析网上信息发布具有如下特点:费用低廉、覆盖范围广、保留时间长、效率高、形式生动活泼、可统计性、实时性、交互可反馈性。而个人获取信息的途径除了常规的HTML网站外,还希望能通过手机、PDA、信息家电、打印机、传真机等各种途径获取。对于信息发布系统来说,要想针对每种输出设备都单独编写要发布的内容将是难以想象的事情。XML的出现,为支持多设备发布提供了条件。服务器只需发出一份XML文件,客户自动运用合适的XSLT,使得多设备多语种支持和广泛的、通用的分布式计算成为可能。另外,政府信息发布的信息源可能来自另外一个网站或部门,这时需要在网站之间建立信息共享的联系通道。基于XML的RDF,RSS和OCS等,就可以解决这个问题。目前,虽然信息发布的主要途径是通过网站,采用的主要技术为HTML,XML并不能完全取代HTML,HTML是描述数据显示的语言,而XML是描述数据结构及其内容的语言,二者在功能上也是截然不同的。电子政务中信息发布主要有四种方式:a)将信息编排、组织、转换成特定格式的页面,放在可以公开访间的路径,由访问者主动来取用。普通的网站都是采用这种信息发布方式。b)主动将信息或信息的链接推送给使用者。这种方式下,用户不必经常访问网站就可以获得由发布者精选的、针对性很强的信息。由于有大量元数据,可由程序自动提取信息内容,XML文档可以很容易地转换成MIME邮件格式,并发布到邮件列表中,以邮件的方式直接发送给信息预订者。还可以利用基于XML的CDF来组织XML页面,根据用户的要求定期发送。另外,ICE提供了一种更高层次的信息订阅和发布的渠道。ICE本身是基于XML的信息传输协议,提供了如下功能:分发信息目录、订阅信息内容、将信息按照预先的安排自动发送给订阅者。。)间接发布,即将信息链接或存放到统一的门户中,访问者通过门户组件来获取信息。信息门户的方式可以集会多渠道的信息以个性化定制的方式提供给使用者更丰富、更有针对性的信息,可以提高信息获取的效率和质量。门户可以集成多渠道信息,给用户一个统一的人口,而且可以支持用户定制的功能,是发展很迅速的一种信息发布方式。门户的初级形式免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/Z19669-2005是RSS,该协议支持用XML描述网站的信息内容和相关链接。RSSXMI,文件被存放在特定的位置上,由门户网站读取并组织在网页中。目前的门户是建立在XML和Webservices基础上的,发布到门户的应用组件(Portlet)不仅仅是文本的信息,也可以是有丰富交互功能的Web界面。XML和Webservices技术被用于Portlet界面组织、Portlet与门户系统的集成等方面。例如:WSRP是异构Portlet与门户系统的集成协议;而WSIA则定义了可用于Portlet的通用Web交互界面。d)将信息与用户端工具集成,以用户感觉不到的方式,获取信息并处理和呈现给用户。有了XML之后,我们应该从纯粹信息发布的侄桔中解放出来。我们发布的信息应该是能够适应多种用途(而不光是由用户人工阅读或下载的)、可以由用户信息接收系统自动处理的。使用XML,我们不必面向不同的用户端系统制作专门的信息发布形式,只需按照目标格式制作XSLT模板就可以按照用户需要的格式发布。很多工具还支持自动或自动的格式映射和转换,可以减轻制作XSLT模板的工作量。这四种信息发布途径各有优势,各有最适宜的使用群体,因此,信息发布机制必须对它们都有所支持。5.3.3.3技术方案下面从W3C支持XML用于信息发布的演变过程,阐述了用于信息发布的几种主要的XML技术。HTML是互联网发布信息的最初的也是常用的方式,但是由于HTML把数据和显示混杂在一起,不利于数据检索和数据重用,也很难支持多种设备。而且HTML结构不严谨,不能被一些格式化工具处理。为此,W3C发展了XHTML语言,也就是XML格式的HTML.。对于XHTMI.格式的文档,不再需要特殊处理,因为其中可以包含一些显示控制命令。另一方面,XHTMI.本身是XML文件,也可以进一步处理,以其他格式显示。为了给HTML增加丰富的显示格式控制,W3C又发展了CSS,它起初用于HTML,后来也用于XML文件的显示。XMI,文档本身一般不包含任何显示信息,需要通过样式表提供显示信息。而XSL(XSLT)就是用于控制XML显示格式和数据转换的语言。使用这些技术,可以把XML文档转换为HTML,XHTML,WML,VoiceXML等标签语言和PDF文档格式,并输出到微机、手机、PDF阅读器及其他输出设备上。如图28所示:梦#W"p1MAtf1xL},h,1a}LatV,#o}f}}Vi7cHAeXhT}ML}LF,:}:XPoDHFT-?ML$,",}xmLPDFNIIAAOtliX*ML01图28XML信息发布示意图另外,在互联网高度发达的今天,网站还要保护客户的隐私。从某种意义上说,XMI.能够解决这一问题,而且已经出现了许多利用XMI,解决隐私问题的标准。a)信息发布的方式一的具体实现主要以HTML和XHTMI.作为技术手段。XHTMI.兼容并扩展了HTMIA,因此称为XHTML.XHTMI,可以简单地理解为HT-MLinXML,即XML格式的HTML,XHTML中的标记和HTML差不多,最主要的改变就是XHTML必须符合XML的标免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/Z19669-2005准规范,使形式更加简明,容易分析。XHTML和HTML的重要差异列举如下:1)XHTML文件必须是格式良好(well-formed)的;2)除了空格标记,任何标记都必须有结尾标记。如<p>必须和</p>成对出现;3)所有的属性都必须被设置值。如<tdnowrap>必须写成<tdnowrap="nowrap">;4)空标记必须加上斜线。如<br>必须写成<br/>;5)script和style必须以#PCDATA的方式显示;6)标记及其属性必须用小写;7)属性必须加上双引号。目前有一些工具可以把HTML转换成XHTML。下面以实例说明如何把HTML文件转换成标准的XHTML。以下是一个可以被很多浏览器解释的HTML文档,这个文件不符合XML格式规范。示例:1<html>23ShiJunHeading4

Hereisthefirstparagraph.5

Hereisthesecond.<br>6Secondlineofthesecondparagraph.781)html标识只有开始标识而缺少结束标识;2)body和hl标识开始标识和结束标识的大小写不一致;3)img标识的链接属性没有加引号,缺少结束标识;4)p和br标识不匹配,同样缺少结束标识。可以用一种工具软件来检测HTML并转换成为XML格式的XHTML文档。W3C组织的DaveRaggett已经提供了这样的软件。使用HTMLTidy,在命令行后加上一asxml的参数,就可以自动为所有空元素加上一个”/”的结束标识。例如,上面的HTML代码会被处理为下面格式的XHTML文件:示例:1<?xmlversion="1.0"?>2<!DOCTYPEhtmlPUBLIC”一//W3C//DTDXHTML1.0Strict//EN"3"http,//www.w3.org/TR/xhtmll/DTD/strict.dtd">4<htmixmlns="http;//www.w3.org/TR/xhtmll">5<head>6<title>78<body>9<hl>ShiJunHeading10<p>Hereisthefirstparagraph.

11<p>Hereisthesecond.<br/>12Secondlineofthesecondparagraph.<imgsrc="somepic.jpg"/>13

1415信息发布的方式二和方式三的具体实现免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/Z19669-2005主要以RDF和RSS作为技术手段。网站的基本功能就是信息发布,目前很多企业、政府已经建立了自己的信息门户,有的还建立了自己的商务门户,用于网上交易和网上办公。网站信息发布的目标是让尽可能多的人浏览到,而这是依赖搜索引擎来实现的。现在的搜索引擎多半是全文搜索,但这对于大的数据量来说未必合适,而且往往搜索到的结果数目很多,真正对用户有用的信息却很少。依赖XML技术在网站之间使用通用协议,将使浏览器搜索时效率和精确度更高。RDF专为此定义了资源和关系的结构。RDF的全称为ResourceDefinitionFramework,主要用途及设计理念都是为了强化目前网络资源的使用。RDF有三个基本对象:Resources(资源),Properties(属性),以及Statements(叙述式)。所有被RDF描述的东西都是“资源”,可能是一份HTML文件或文件的一个片断,甚至是网络上无法存取的一个实体。但是“资源”必定是用一个URI来表示的。“属性”则是关于一个“资源”的存储,比如说这个资源的实效性,或者是否属于机密文件等。“叙述式”则是RDF最重要的部分,它赋予“资源”和“属性”一个“关系”。每个“叙述式”都可以分成三部分:“主词”、“叙词”和“受词”,其中“受词”部分可以是个RDF对象,或者可以用一个字符串来表示。如果要用RDF来表示某份文件的作者,可以用如下方式叙述:示例:1主词(资源):http://www.ucap,com.cn/xml.html2叙词(属性):作者3受词(子符串):steven4用RDF语法表示如下:567steven<八ntumit>89实际上,所有RDF叙述式都可以用这样类似的句子说出来:“某个资源”的“属性”是“属性值”。而使用许多RDF叙述式可以累积起丰富的关联数据。目前,RDF在比较大的资源聚集区都使用了。使用这种通用格式,搜索引擎就能高效地检索网站发布的信息。RSS作为RDF的一种应用,是由MyNetscapeNetwork的频道发展而来。RSS对RDF做了简化,并得到了广泛的应用。RSS全名为RichSiteSummary,是一个使用RDF制定出来的标准。主要目的是提供简单的规范以编写网站的摘要,对于门户网站或是提供新闻的网站来说非常方便。RSS的规范相当简单,而且文件不大,所以已经成为一些门户网站所直接使用的标准了。c)信息发布的方式四的具体实现主要以CSS和XSL作为技术手段。XMI,文档本身只描述数据内容,它的显示功能由样式表来完成。利用样式表技术时,输出平台不局限于显示器,还可以是打印机、绘图仪或者是多媒体播放器。使用独立的样式表文件制定显示格式的一大优势在于:对同一份数据文件可以制定不同的样式风格,应用在不同的场合,使数据能够更合理、更有针对性地表现出来,提高了数据的重用性。目前,W3C正式推荐的样式表标准有两种:一种是层叠样式表("SS,另一种是可扩展样式表语言XSI.o1)CSS最初是用于制定HTML文档显示格式的,现在也可用来对XML文档进行简单的格式化。CSS在HTMI一中的应用极为广泛,但它在文本置换、依据文本内容决定显示方式、对数据进行排序等智能化的显示功能上略显不足。免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/Z19669-20052)XSL则较好地解决了CSS的这些问题,它最常用的功能是将XML的标签转换成为HT-ML的标签并显示输出。而且XSL还可以将XML文档向任何其他格式的结构文档进行转换。每次改换页面风格时,只需改换模板就可以了。而且,XML信息内容中没有与显示有关的代码(这些代码通常要占50%到80%的篇幅),因此既节省了工作量,同时也提高了页面系统的可维护性、减少了出错的概率。在使用XSLT时,最简单的应用情况涉及到两个文档:包含原始数据的XML文档和用来转换该文档的XSLT样式表。XSLT处理器把XSLT样式表的规则应用到XML文档从而新建出XHTML,WMI_,SVG或者其他任何XML格式的第三个文档。一份XML文档可以用多份XSLT样式表显示,还可以把XML实例数据转换为其他格式的XML数据,如图29所示:stsyXolMuSersLLchTeetlPrXocSeLsTsororXotoHhueTtrpMuXtLML图29XML工作方式示意图在基于XSL开发WEB应用时,分为两种模式:1)服务器端转换模式:有实时和缓存两种方式,实时方式是当服务器接到请求时再进行实时转换,这种方式对服务器要求较高;缓存方式是利用缓存技术,事先用XSL将一批XML转换成HTML文件,服务器接收到请求后从缓存中提取即可。XML文件在输出到浏览器前,先被转换成HTML(或XHTML等),然后再将HTML文件送往客户端进行显示。2)客户端转换模式:这种方式是将XML和XSL文件都传送到客户端,由浏览器实时转换,前提是浏览器必须支持XML+XSL,一般情况下,XML源文件中会指明欲使用的XSLT文件,而此XSLT文件指示处理器如何把XML源文件转换至另一种格式的文件。下面是一段XML格式文档:示例:1Gpoem>2<title>FromBookIG八itle>3Gexcerpt>4Aloft,incumbentontheduskyAirthatfeltunusualweight,tillondryLandHelights,ifitwereLandthateverburnedWithsolid,astheLakewithliquidfire;Forwhocanyetbelieve,thoughafterlossThatallthesepuissantLeginos,whoseexileHathemptiedHeadn,shallfailtore-ascendSelf-raisd,andrepossesstheirnativeseat.16然后定义一个样式表文件:示例:123456789101112

如果应用需要将XML转换成HTML输出,并希望HTMI,能被尽可能多的浏览器正确阅读,可如上所述,将xsl:output元素的method属性设置为”html”就能实现。例如在上面的样式表中xsl:output元素告诉XSLT解释器,当遇到空的HTML元素时(如br,col,frame,hr,input,link,meta等),则将其作为一个单独的没有”/”结尾的标识来处理。然后,把样式表应用于XML文件,XSLT解释器转换得到下面的结果:示例:1<!DOCTYPEhtmlPUBLIC”一//W3C//DTDHTML4.0Transitional//EN">234FromBook15

6Thenwithexpandedwingshesteershisflight
7Aloft,incumbentontheduskyAir
8thatfeltunusualweight,tillondryLand
9Helights,ifitwereLandthateverburned
10Withsolid,astheLakewithliquidfire;
n

12
13

14Forwhocanyetbelieve,thoughafterloss
15ThatallthesepuissantLeginos,whoseexile
16HathemptiedHeadn,shallfailtore-ascend
17Self-raisd,andrepossesstheirnativeseat.
18

19
2021可以看到,每一个excerpt元素被替换成一个p元素,并且在后面加了一个横线,每一个verse元素被替换成一个br元素。因为样式表里的xsl;output元素属性的作用,上面例子最后生成的文档中br和hr元素是没有结束标识”/”的,正如原来的HTML一样。免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/Z19669-2005这样的文档在任何版本浏览器中都不会有问题。通过DaveRaggett的Tidy程序和xsl,output元素,就可以将所有老格式的HTML文档转换到以XSLT为基础的新系统中去。如果不是自己用XSLT处理工具,而是让浏览器去解析,则需要在XML文件中明确地把XSL文件和它关联,如:示例:1<?xmlversion="1.0"encoding二”U"lF-8"?>2<?xml-stylesheethref="mystyle.xsl"type="text/xsl"?>3mycontent<八est>同样,作为信息发布的方式四的具体实现,同一份XML内容希望自动支持PC,WAP,PDA等多种设备。随着无线上网技术和设备的成熟,对WMI,语言和WAP设备的支持已经成为网站信息发布的一种重要方式。在此,只对WAP设备的特点和WML语言的程序结构做简要介绍。无线置标语言WML(WirelessMarkupLanguage)是一种基于XML的语言。它可以显示各种文字、图像等数据,是由WAP论坛提出并专为无线设备用户提供交互界面而设计的,这些无线设备包括移动电话,呼机和个人数字助理PDA等。一般而言,使用WML的无线设备通常具有以下特点:1)与普通的个人计算机相比,体积较小,电能受限;2)设备的内存有限,且其CPU性能也有限;3)通讯带宽较窄、时延较长。WML程序的基本结构:1)语法:WML与HTML相似,仍然是一种置标语言,并且延续了XML的语法规则;2)声明:所有的WML程序必须在文件的开头处声明XMI,文件类型,包括XML的版本、WML的文档类型、所用规范等;3)标签:在WML语言中需要使用标签,其使用形式与HTML和XML等置标语言中的形式是完全一致的;4)元素:WML的元素(Element)用于描述卡片组(Deck)的标记信息即结构信息。一个元素通常由一个首标签、内容、其他元素及一个尾标签组成;元素包含的内容中还可以有元素,不包含内容的元素称为空元素;5)属性:WML与XML一样,其标签可以包含很多属性。属性用于给标签提供必要的附加信息,且属性内容通常在起始标签内使用。不过,属性内容不会被浏览器显示,它只作为参数为标签提供必要的信息;6)注释:WML程序中也可以加人注释。注释内容用于给开发人员顺利阅读源代码提供方便,它不会被浏览器显示出来;7)文档结构:WML文档是由“卡片(Card)”和“卡片组(Deck)”构成的,一个Deck是一个或多个Card的集合。下面是WML程序的基本结构:示例:1<?xmlversion="1.0"?>2<!DOCTYPEwmlPUBLIC”一//WAPFORUM//DTDWML1.WEN"http;//www.wapforum.org/DTD/wml_1.1xml">345689Somecontents.,.1011该基本结构可以分为以下几个关键部分:1)声明:WML程序有许多Deck组成,对于每一个Deck,在其文档开头必须进行XML和文档类型DOCTYPE的声明。XML声明总是在文件的第一行,注意前面最好不要有空格或者回车符:<?xmlversion="1.0"?>,紧跟着是DOCTYPE声明,注意声明字母是区分大小的:<!DOCTYPEwmlPUBLIC”一//WAPFORUM//DTDWML1.1//EN",http://www.wapforum.org/DTD/wm址1.lxml">;2),用于提供当前Deck的meta信息,包括内存数据处理方式,以及数据传输方式和处理方式等;6)。d)信息发布的隐私策略目前,有许多标准组织和机构都在进行利用基于XML的技术解决与隐私相关的各方面问题的研究。其中隐私参数选择平台(P3P)是由W3C开发的一个协议,它描述了一种计算机能够理解、网站可以用来描述它们的隐私政策的基于XML的语言。信息的种类包括声明隐私政策的实体的联系信息、用户是否可以访问他们被收集的个人资料、被收集的信息的不同类别、收集资料的目的以及哪些机构能够访问收集的数据等。P3P是对长期以来网站向用户提供的机器不能理解、容易引起歧义的“隐私”政策的响应。下面是一个假想的网站的P3P策略:示例:12345WebSite.com6200MainStreet78910免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/Z19669-20051112131415161718上面的P3P策略表示,该公司没有获得任何个人身份资料(PII),仅获得了用于管理和开发目的的动态HTTP数据记录。在IE6中已经包含了对P3P客户端的支持。而且已经出现了利用XML强化隐私的技术,这些技术包括XML访问控制、数字加密和身份认证等技术,而且这些技术还在不断地完善中。5.3.4信息采集5.3.4.1典型应用场景在电子政务中,通过网站收集企业、个人的信息是普遍的做法。例如,针对企业和个人的金税工程。企业和个人都可以在网上直接报税,人们可以坐在自己的办公室或家里完成。业务系统能立即在客户端或服务器端对用户提交的数据做严格的规则检查,以保证人们提交的数据都是合法的。这是在线信息采集的过程。对于不便联机报税的用户,政府在网站上提供了和在线填写一样外观的电子表格,用户可以直接下载打印,或直接到就近的税务机关领报税表。在人们提交后,税务机关的业务员把纸张上的数据录人后台系统,这是完全的离线信息采集的过程。还有一种情况就是,有的用户虽然有条件上网填表,但是由于数据量大,在填写过程中还要查找相关资料,有些项目可能要等候多时才能得到。如果一直联机填写,一是安全性得不到保证,二是对于拨号上网的用户,费用也是不得不考虑的问题。因此需要提供离线填写、随时挂起和继续、联机提交的功能。除了这种交互式的信息采集过程,跨系统的数据采集需求和应用也是经常遇到的,特别是政府各部门联合办公或数据共享时,尤其重要。就拿前面的税务系统来说,银行要考察某个单位或个人的信用和偿还能力,则可以通过应用接口,采集税务机关内部系统的数据,实现数据共享。另一个例子是,公安局出人境管理处在给公民办理护照或签证时,会从个人的户籍管理系统中调用个人档案,以决定是否发放护照或签证。这种集成意义的信息采集方式在政府(包括银行、电信等企业机构)的联合办公中起着巨大的作用。由此可见,信息采集有两大类方式:交互式的信息采集和集成方式的信息采集。交互式的信息采集面向的对象是最终用户,而集成方式的信息采集则在多个系统之间发生。交互式的信息方式种类繁多,除了电子方式外,还有基于纸张、语音等其他媒介的方式。而集成方式的信息采集一般是通过计算机程序自动完成的。广义的信息采集概念应该包括这两种信息采集方式。5.3.4.2应用需求分析信息采集无论是在一般的电子商务应用中,还是在电子政务系统中,都是极为重要的组成部分。一个业务系统主要包括如下部分:数据及定义数据的模式规则,过程及定义过程的业务流程,而数据在业务处理中起支配作用。业务从数据的采集开始,以数据的存储结束,中间贯穿的是对数据的处理和运用,完全体现了以数据为中心的思想。当然,信息和数据还是有差别的。一般来说,信息是经过加工并且有用的,而数据并不总是这样。要从原始数据变为信息,还要经过对数据的过滤、转换和检验等预处理过程。下面就这两种信息采集方式做详细的描述,并就这些采集方式中用到的XML技术加以介绍和示例。a)交互式信息采集一般来说,在交互式信息采集过程中,有如下需求:减少甚至消除纸张;对表单的自动化处理,以集成到应用系统中;用HTML,AdobePDF和XML等多种格式实现在线的电子表单;免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/Z19669-2005支持自动的电子表单合法性验证和自动填写;支持数字签名和保护用户隐私;及时响应及提供使用向导。以上可以看出,多种格式的表单形式、表单的自动化处理、联机或脱机填表、数字签名和隐私政策、提供向导等正是数据采集要关注和实现的。一般的业务流程往往是从数据获取开始的,而且通常通过使用表单来完成。美国政府办公无纸化行动GPEA(GovernmentPaperEliminationAct)更能说明信息采集在电子政务中的重要作用。GPEA要求各地联邦政府,保证每种信息的收集可以通过电子方式提交、维护、批示,并告诉公众如何使用这些手段。政府需要能为公众提供多种渠道的服务,特别是通过网络。很多组织也都在寻找一种方法使得基于网络的数据采集更加有效,并让最终用户用起来很方便。因此需要提供一致的易于使用的数据采集所用的表格。政府在信息采集时主要提供两种手段:纸张表单和电子表单。随着计算机应用的普及,纸质表单会越来越少,而一般都采用一些流行的办公软件,如金山WPSOffice和微软MSOffice系列,来制作电子表单。鉴于AdobeAcrobat已经成为事实上的制作电子表格的工业标准,很多政府机构也提供PDF格式的表单。电子表单制作完成后,再打印出来分发给个人。个人在纸张表单上填写,并上交给政府。有的是把电子表单存放在政府网站上,有条件的个人通过网络下载到本地。个人先打印再手工填写,或者先在电脑上填写再打印。有的政府还提供了在线提交的方式,常用的就是建一个网站,以HTML表单格式采集个人联机填写的信息,在后端对采集的数据进行处理,并存储到数据库中,或者以纸张形式打印出来。有的政府把纸张表单扫描,以电子表单形式保存起来。但是,这些方法都不能很好地满足电子政务数据采集的需要。政府希望在数据采集时能满足如下要求:1)提供个人多种格式的电子文档。这些格式可以是WORD文档、PDF文档、HTML表单等;2)不管是发布哪种格式的文档,只用排版一次,也就是“设计一次,发布多次”;3)部门间数据交换是很频繁的,而且希望有些数据可以永久保存而不依赖于某种特定的应用系统(如Word工具),希望找到一种通用的数据存储和交换格式;4)能提供个人联机填表和离线填表两种功能。而且在联机填表的过程中,提供暂停和恢复功能。可以在一个页面显示多个表单一起提交,或者把大表单分成子表单在多个页面完成;5)支持多种输出设备:微机、移动设备、打印机、传真机、扫描仪等。基于XML技术的XForms的出现,很好地满足了交互式信息采集的需求。b)集成方式的信息采集集成方式的信息采集实主要包括数据交换、数据传输、数据存储三大过程。数据交换首先需要交换的双方就数据的语汇、规则和结构进行协商,否则就无从谈交换。这需要用XMLDTD,XMLSchema来定义。如果数据格式不一致,就需要使用一些格式转换技术,如XSLT来做数据转换。而电子政务系统中除了来自业务系统的结构化数据,还有来自公文系统的非结构化数据(文档型数据),因此还需要进行文档型数据和XML,DB这一类的结构化数据的转换。对于现在基于WEB服务方式的动态电子商务(政务),服务描述(WS-DL)和数据发现(UDDD也是不可缺少的重要方面。在数据传输的过程中,要定义一套通用的数据绑定和访问协议(SOAP),以便和各种传输协议相适应;还要保证数据传输的安全性和不可抵赖性,为此使用了XMLSECURITY技术。数据存储时可能要从XML格式转换为另外一种格式,或者转换后存人数据库。这需要免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/Z19669-2005XSLT,XML2DB和DB2XML等技术。在做信息集成时,最需要关心的是来自各应用系统的数据源的格式。XML数据源多种多样,根据具体的应用,大概可分为下面三种:一种是XML纯文本文档,第二种是关系型数据库,第三种则来源于其他各种应用数据,如邮件、目录清单、商务报告等。其中,第一种来源是最基本的也是最为简单的,将数据存储于文件中的优点在于可以直接读取,或者使用样式表CSS及XSLT格式化,以便在浏览器中显示,或者通过DOM,SAX编程接口同其他应用相连。第二种数据来源是对第一种来源的扩展,其目的是便于开发各种动态应用,其优点在于通过数据库系统对数据进行管理,然后再利用服务器端应用(如ASP,JSP,Servlet)等进行动态存取。这种方式最适合于当前最为流行的基于三层结构的应用开发。第三种数据由于来源广泛,因此需要具体情况具体对待。总之,实现系统间的信息采集,涉及两类技术层面,一是系统间多界面多接口互联问题,二是应用集成问题。前者解决“沟”的问题,“沟而不通”是“政府上网工程”后的普遍现象;后者才解决“通”的问题;“政通”方能“人和”,足见机构间应用层对话与整合的重要性。但单这两层模型无法描述电子政务所需技术环境。仅以机构一公务员一公众用户之间界面为例,“三网”虽采用互联网技术,靠TCP/IP实现互联早已不成问题,但界面多样性就增加了G2G,G2B,G2E,E2E(政府机构间、机构对企业、机构对公务员、公务员社区)的复杂度。如机构间交换数据时,就得面临几种情况:一批机构的收件窗是网站,就要写一段HTTP收发程序;另一批机构的通道是FTP,这需与其FTP服务器沟通;再一批机构通过E-mail收文件,需要通过邮件群发向各Mail地址发信;公务员出行中时,又得通过手机、PDA、语音信箱等接收与处理信息。机构间应用集成面临的困难更多,首先是各种操作系统问题。如Windows,UNIX,Linux,IBM主机等,利用COM技术尚可实现Windows系列应用程序间的整合,但对UNIX和其他非MS操作系统就不行了。跨越这道难题后又得应对系统间应用集成问题:真正的G2G,G2B建立在系统间直接对话上,这涉及各类结构化与非结构化数据资源、文本与视频资源、各种分类与代码体系、记录格式之间的转换问题;甚至更深地涉及各机构内部数据、文件描述在格式、语义上的一致性,以及作单位业流程间的协同与衔接。政务流程如何整合是最难的,因为它不只是技术问题,还涉及各条块机构间的流程边界划分、作业界定和大量转换协调工作等。以往各机构OA,MIS都将各类作业分散在自己内部的各个应用程序及数据库中,导致跨机构间作业往往要重复在多个机构间输入、输出;而在构建电子政务新服务项目如一站式办公、一站式服务时,重新规划整合各机构系统,实现数据与功能间的无缝联接才是最困难的。5.3.4.3技术方案XForms能满足交互式信息采集的需求,需要指出的是,XForms现在还很不成熟,仍然处于草案阶段。目前能直接支持XForms语言的通用应用程序不多,如IE和Netscape浏览器都不支持XForms语言,但是基于XForms规范实现的电子表单工具却越来越多。最初的在线信息采集一般是通过HTMLForm的方式来实现的。随着业务种类和需求的增多、涉及到的Form也越来越复杂,现有的Form机制已经显得力不从心了。XForms是新一代的WebForm,是HTMLForm的延展和强化。但是不像HTMLForm只是HTML网页的一部分,XForms考虑到未来多元化的上网方式(如桌面计算机、移动手机、掌上电脑等),所以将Form结构做了整体设计,尤其是将数据模型和用户接口分离。XForms也是一个XML应用,代表下一代的Web表单。通过把传统的HTML表单分成三部分:XForms模型、实例数据、用户接口,实现了内容与表现的分离,允许数据重用,减少数据在服务器和客户端来回传递的时间和次数,提供了设备独立性,减少脚本编制。XForms不是独立使用的一种文档类型,而是要集成到其他置标语言中使用,如XHTML或SVG。图30是XForms在数据采集中的应用示意:免费标准下载网(www.freebz.net)无需注册即可下载 免费标准下载网(www.freebz.net)GB/Z19669-2005少图30XForms在数据采集中的应用示意图XForms共分为三个部分,XForms模型,XForms用户界面、XForms提交协议。a)XForms模型XForms模型用XML语法描述了数据模型的部分。例如:示例:1234678XForms模型的作用在于定义一份实例数据的结构,不考虑实例数据中各个元素或属性与用户界面中各个控件的对应关系。这和XMLSchema定义一份XML数据的结构相类似,但由于功用不同,毕竟还是有些差异。XForms模型提供的功能主要有:1)定义出XML实例数据的结构,即XForm。模型可以决定提交后的实例数据及其基本结构。如:有哪些元素及数据类型是什么?层次和包含关系如何?2)自定义复合类型的数据,以供重复使用;3)定义每个数据域必须符合的条件,例如成立时间限制;4)定义各数据域间的相互关系,例如填写日期不得小于成立时间。上面前三点在XMLSchema中都有类似的功能。但是第四点是XForms模型所特有的,称为动态限制条件,某个输人域填写的内容是否有效,根据其他域的值而定。在HTMLForm中我们必须编写脚本语言来达到这种功能,而在XForms中是很容易实现的。b)XForms用户界面XForms用户界面定义一些组件,这和HTMLForm中的组件差不多,只是加强功能而已。下面提供一个简单的例子,用来输人一般的文字数据,类似HTML中的<input>或