|  客服中心  |  合作联系
搜刊网
论文下载
您当前位置
首页 > 论文下载 > 信息科技 > 一种基于XML的异构数据库集成方法的研究
一种基于XML的异构数据库集成方法的研究
来源:互联网 qikanw | 乔玮
【分  类】 信息科技
【关 键 词】 XML;中间件;数据集成;异构数据库
【来  源】 互联网
【收  录】 中文学术期刊网
正文:

  摘 要 异构数据库的集成是当前数据库研究领域内的一个热点,它能更有效地利用信息资源、实现数据共享。本文论述了一种基于XML中间件的异构数据库集成方法。首先介绍了异构数据库集成系统整体框架结构的层次模型和每一层的服务功能,然后对其中的关键问题,如关系数据模式到XML Schema模式转换及查询分解方法进行了讨论,最后阐述了该异构数据库集成方法的优点。

  关键词 XML;中间件;数据集成;异构数据库

  中图分类号:TP311.13 文献标识码:A

  Abstract: The integration of heterogeneous database, which can exploit the information resources effectively and realize the data-sharing, is one of the active points in the current database researching field. An approach of heterogeneous database integration which is based on the XML middleware is introduces. This paper firstly introduces the hierarchical pattern of the heterogeneous database integration system framework and the functions of each scale, and then discusses several key points such as the pattern conversion for relation schema to XML Schema and the inquiry distribution algorithm, and lastly the advantages of this approach were expatiated.

  Key words: XML, middleware, data integration, heterogeneous database.

  0 引言

  现代企业普遍应用数据库技术来管理各种数据,多数企业在发展过程中积累了大量的数据,这些数据可为企业的业务发展和经营规划提供参考。但在许多情况下,由于企业内部各单位和部门的业务及职能千差万别,而且使用数据库应用系统是在不同时期、根据不同的需求建立的,开发标准、数据库平台、数据格式等不同,因此在企业数据共享中形成了“信息孤岛”。为了使存在于不同数据库管理系统中的数据能够实现共享,使用户能快速地通过一个全局查询便可以得到一个综合结果,而不必考虑各物理数据库的分布和结构组成,就需要建立一个高效的异构数据库集成访问方法。

  数据库中间件技术通过提供一个全局模式和对应各数据源的局部模式,集成来自不同数据源的数据,不需考虑数据库的模型和运行平台[1]。XML(eXtensible Markup Language)是 SGML(Standard General Markup Language)的子集,作为一种可扩展标记语言,其自描述性使得XML本身非常适用于异构数据应用间的数据交换,由于XML能够描述不规则数据,能够从不同的来源集成数据,因此将XML作为数据的描述工具和转换工具来构造数据集成的中间件,是实现异构数据集成的较理想的解决方式[2]。

  1 异构数据库集成方案

  本文中的异构数据库是指相关的多个数据库系统的集合,异构数据库的各个组成部分具有自身的自治性,每个局部数据库拥有自己的DBMS(可以是同为关系型数据库系统的Oracle、 SQL Server等,也可以是不同数据模型的数据库,如关系、模式、层次、面向对象数据库等),在实现数据的共享和透明访问的同时,每个数据库管理系统仍然保有自身的完整性控制和安全性控制。

  基于XML的异构数据库集成方案的基本框架如图1所示,它分为三层结构:分别为应用层、中间件层和数据源层,中间件层构建在各数据库系统之上,数据应用程序服务器之下,在不改变异构数据源原始数据存储和管理方式的情况下,集成各个异构数据源信息,为数据的共享和应用提供访问支持,负责异构数据源的数据访问和查询,同时协调各数据源之间的信息集成。该方案将XML技术与全局数据模式相结合,在中间件中以XML文档进行数据的交互,它能够转换来自不同数据源的数据(包括结构化数据和半结构化数据),使数据交换保持了平台独立性原则,降低耦合性,提高了重用的可能性,这样就使异构数据源集成中间件能更好地适应开放、发展环境中的数据集成。

  本方案中的中间件层主要由注册器、查询处理器、结果处理器和包装器四个模块组成。注册器主要负责异构数据库的注册服务,并生成公共模型;查询处理器需要根据用户提交的查询请求,将基于总体视图的查询分解为针对各个数据源的子查询,并提交给包装器执行;结果处理器把包装器的结果汇总处理,以XML的方式返回;包装器负责与底层数据源交互,包装异构数据源,实现数据位置和访问的透明性。

  图1. 异构数据库集成方案框架

  Fig.1 Heterogeneous Database Integration System Framework

  该构架的工作流程及所实现的功能为:应用程序服务器接收客户端发送的查询请求,该查询请求为全局查询请求,可能需要访问数据源层中不同数据库中的信息。中间件层接收全局查询,根据各异构数据源注册的共享信息进行分析,查询处理器将全局查询分解为针对具体数据库子查询,并将子查询发送到对应的数据源。数据层中的各数据库管理系统接收到查询后,从数据库中查询相关信息,把查询结果返还给结果处理器,结果处理器将其合并成同一笔数据记录,并将得到的全局查询结果返还给应用程序服务器,应用程序服务器再将用户请求的结果返回给用户。以上过程均以XML文档为数据转换的中介格式。同时,该方案具有扩展性,如要添加新的数据源访问需要,只需向中间件系统进行注册相关信息即可实现,即该中间件系统具有弹性环境,有利于日后系统的维护。采用该异构数据库集成方案可解决企业异构数据库访问中的存在的异构性、透明性、自制性等难题。

  2 异构数据库集成方案中的关键技术

  从实现角度来看,由于应用层和数据源层相对比较简单,在此主要对中间件层的关键技术进行讨论。

  2.1公共模型的建立

  这部分主要包括局部数据库关系模式的提取及关系数据模式到XML Schema的转换。

  关系模式提取方法的目的是构建共享数据库的关系模式(包括表、字段、属性、主键和外键),保证数据提取的完整性,为进一步的模式转化提供基础。其输入为在数据库注册流程结束时,中间件层所接收到的局部数据库连接信息(数据库名称、数据库用户名、密码以及主机地址)和数据库类型。输出是数据库关系模式的列表表示集,结果可采用一个一维数组和多个二维数组分别存储注册异构数据库中的关系表表名和每个表的属性字段名称、字段类型、可否空、主键和外键属性。

  由于XML DTD采用了非XML文档语法规则、不支持数据类型等原因,在关系数据模式到XML模式转换中使用DTD无法对关系表之间的约束进行转换[3,6]。而XML Schema的语法结构比DTD复杂,比DTD更具有表现力、更适应于各领域应用的使用[4,7],所以本文讨论包含约束条件的数据库关系模式到XML Schema转换算法来实现数据库关系模式到XML的转换。

  算法描述如下:

  ①为每一个异构数据源模式转换为XML Schema的转换结果定义唯一的命名空间。

  ②对每一个表R和字段A1,…An,创建复杂类型元素和子元素Al,…An,并设置各个子元素的数据类型。对于数据库DataBase和表R1,…Rm,在XML Schema中增加一个DataBase元素,并插入一个复合类型元素,其子元素分别R1,…Rm,各子元素相应的数据类型为每个表创建的复杂类型。

相关推荐
热门期刊
四川医学《四川医学》
《四川医学》杂志,于1980年经国家新闻出版总署批准正式创刊,CN:51-1144/R,本刊在国内外有广泛的覆盖面,题材新颖,信息量大、时效性强的特点,其中主要栏目有:卫生管理、...
中国教育技术装备《中国教育技术装备》
并非《中国教育技术装备》杂志官方网站。办理其他业务请直接联系杂志社。 《中国教育技术装备》杂志,于1987年经国家新闻出版总署批准正式创刊,CN:11-4754/T,本刊在...
西北美术《西北美术》
《西北美术》杂志,季刊,于1982年经国家新闻出版总署批准正式创刊,由陕西省教育厅主管,西安美术学院主办的学术性刊物,本刊在国内外有广泛的覆盖面,题材新颖,信息量大、...
新能源进展《新能源进展》
《新能源进展》将跟踪新能源热点领域,反映较新研究成果,主要报道我国新能源与可再生能源,包括太阳能,生物质能,风能,海洋能,地热能,天然气水合物等领域科学技术...
南方人物周刊《南方人物周刊》
《南方人物周刊》杂志,于2004年经国家新闻出版总署批准正式创刊,CN:44-1614/C,本刊在国内外有广泛的覆盖面,题材新颖,信息量大、时效性强的特点,其中主要栏目有:文化、...
照相机《照相机》
《照相机》杂志,于1979年经国家新闻出版总署批准正式创刊,CN:33-1090/TB,本刊在国内外有广泛的覆盖面,题材新颖,信息量大、时效性强的特点,其中主要栏目有:使用报告、维...
友情链接
中教杯 国家新闻出版总署 中国知网 万方数据 维普网 中国科学院 中国国家图书馆 央视英文版 中国留学网 中青网 中国国家人才网 中国经济网 中国日报网 中国新闻网 中国学术期刊网
关于我们
平台简介
诚聘英才
企业文化
竞争优势
版权信息
服务条款
客服承诺
常见问题
版权声明
合作加盟
期刊加盟
广告服务
联系我们
网站导航
期刊大全
论文下载
课题申报
学术会议
编辑QQ
编辑联络
2007-2023
中文学术期刊检索机构
bianjibu777@qq.com
联系我们

版权所有©2007- 2023 中国学术期刊网(qikanw.com) All Rights Reserved 京ICP备2021008252号
本站是学术论文网络平台,若期刊网有侵犯您的版权,请及时与期刊网客服取得联系,联系信箱: bianjibu777@qq.com    
中国学术期刊网