您好,欢迎来到六九路网。
搜索
您的当前位置:首页元数据技术研究

元数据技术研究

来源:六九路网
第33卷增刊 201 1生 舰船科学技术 Vo1.33,Supplement 2011 SHIP SCIENCE AND TECHNOLOGY 元数据技术研究 赵文涛 ,郭晓利 (1.武汉数字工程研究所,湖北武汉430074;2.q-国舰船研究院,北京100192) 摘 要: 随着信息技术的发展,各个领域的元数据大量涌现,无数据之间的集成互操作是 个普遍的问题。 本文对元数据在多个领域的定义进行描述,对常见的元数据标准进行分析比较,对元数据互操作的关键技术进行分 析研究,对元数据集成体系结构进行详细分析,最后对元数据的应用框架进行描述。为今后无数据技术的应用提供 支撑。 关键词: 元数据;元数据集成;元数据应用框架 中图分类号:TP311.13 文献标识码: A 文章编号: 1672—7649(201 1)S一0088—04 DOI:10.3404/j.issn.1672—7649.20l1.s.02l A study of metadata technology ZHAO Wen—tao’GUO Xiao—li ,(1.Wuhan Digital Engineering Institute,Wuhan 430074,China; 2.China Ship Research and Development Academy,Beijing 100192,China) Abstract: As the development of the information technology,various fields constitute their metadata. The integration and the cooperation between different metadata standards become the prevalent problem.The paper describes the definitions of different fields,analyzes the various metadata standards,investigates the key technology of metadata cooperation,labors the metadata integration franle,and illustrates the frame of metadata application.And the paper can be used as a reference for further metadata application development. Key words: metadata;integration of metadata;frame of metadata 0 引 言 随着信息技术的发展,信息共享的环境也发生着 1 元数据定义 Metadata在我国被泽作冗数据,而在我国台 湾则被译作“元资料”、“诠释资料”、“后设资料”、 “文后资料”、“超资料”等多种名称。迄今人们对该 术语的翻译和理解尚不统一一,不过国内一般都称为元 数据 变化。元数据作为信息组织和处理的基本工具,其性 质、范围和作用也发生演变。早期图书馆对大量的图 书进行编目的图书卡片式的元数据,发展到信息时代 描述数字信息和数字资源的各个层面的元数据。元 数据已经成为联接、协调、整合和控制信息资源各个 层次,甚至整个信息服务体系的工具和纽带,成为信 息共享的基础。因此,有必要对元数据技术进行系统 的研究。 元数据最本质、最抽象的定义为“说明数据的数 据”,在不同的领域有广泛的应用,针对不同的领域 其具体的定义也有差别。 在数据仓库领域中,元数据被定义为:描述数据 本文将对元数据定义、标准、集成体系结构、互操 作和应用等方面技术进行分析研究。 及其环境的数据¨ 。作用是提供基于用户的信息, 帮助用户使用数据,支持系统对数据的管理和维护。 收稿日期:2011—05—31 作者简介:赵文涛(1987一),男,硕士研究生,研究方向为数据处理。 增刊 赵文涛,等:元数据技术研究 表1常见元数据标准 Tab.1 The ordinary metadata standards ・89・ 在信息界元数据被定义为提供关于信息资源或 数据的一种结构化的数据,是对信息资源的结构化的 描述…。其作用为描述信息资源或数据本身的特征 和属性,规定数字化信息的组织,具有定位、发现、证 明、评估、选择等功能。 哈佛大学数字图书馆项目定义元数据为:元数据 是帮助查找、存取、使用和管理信息资源的数据。其 作用是识别,描述和定位图书资源。 美国防部对元数据的定义是:提供数据源的描述 并使用注册、编目和共享空间等机制来存储元数 据 。作用是支持数据源发现和互操作,以及数据 和元数据的语义理解。 总而言之,元数据在各个领域有与该领域相适应 的定义和描述,概括来讲元数据的作用有6点 :资 源确认和检索,详细全面地描述数据单元、资源组织、 资源保护和长期保存,系统功能与执行的描述和系统 建模。 2元数据标准 元数据标准是描述特定资源或信息的规则集合。 依据不同领域的特点制定相应元数据标准,提高元数据 应用构建的效率,同时使得元数据使用更加规范。表1 列出了常见的元数据标准的内容特点和适用范围。 元数据标准的制定都是以特定的应用为背景的, 符合应用需求即可,没有必要包罗万象。设计标准时 要平衡个性化和通用性、简单易用和描述能力。同 时,要保证和其他元数据标准的互操作。 3 元数据互操作 目前,在分布式环境中,元数据的类型多种多样, 并且都得到不同程度的应用。如何利用不同格式的 元数据为用户提供一致的服务是元数据应用领域不 可避免的问题。而元数据的互操作为这一问题的解 决提供了可行方案。 元数据互操作可以支持跨系统的整合检索、信息 组合、服务集成,支持分布环境下用户管理和支持产 权管理,支持基于分布服务体系的动态系统机制。通 过元数据互操作,可以保障任意系统的用户能在整个 分布环境中发现、检索和利用所需的资源和服务 。 元数据互操作分为7个层面 ]:交换格式互操 作,标记格式互操作,元素内容结构互操作,元素语义 互操作,编码规则互操作,数据内容互操作和协议互 操作。 实现上述的元数据互操作的技术有元数据转换、 元数据复用、元数据开放搜寻和元数据语义转换。元 数据转换指通过一定的映射模版,实现2个元数据格 式之间元素的直接转换;元数据复用指通过在1个元 数据格式中复用另1个元数据格式的部分元素,利用 不同元数据格式共同描述复杂资源;元数据开放搜寻 指通过公共元数据搜寻协议和公共简单元数据集,支 持分布和异构信息对象的跨系统发现与检索;元数据 语义转换指通过元数据语义定义和元数据概念集,支 持2个元数据格式间元素通过语义分析甚至传递的 转换。 4 元数据集成体系结构 元数据集成体系结构分为静态和动态2个方面, ・90・ 舰船科学技术 第33卷 静态的元数据互连体系结构和动态的元数据生命周 期体系结构 。 4.1 元数据互连体系结构 元数据互连体系结构描述了元数据共享交互的 物理连接。常见的元数据体系结构有以下3种: 1)点对点元数据互连体系结构 图2集中式元数据互连体系结构 Fig.2 The centralization metadata interlink architecture 元数据分布在多个元数据源,每个元数据源可能 是异构的。不同元数据源通过元数据桥建立点对点 的连接。元数据桥负责异构元数据之间的转换。元 数据桥必须理解每个要集成的元数据的定义和格式。 对于1个元数据源只有建立了同集成系统中的其他 元数据源的元数据桥才能实现元数据之间的互通及 转换。如果有n个元数据源的系统,要实现任意2个 源之问互通就要建立(n(n—1))/2个元数据桥。每 个元数据桥只能对固定的元数据进行转换,元数据桥 的复用性很差,且维护的代价高。此外,元数据转换 时不可避免的要丢失一部分信息,这也是元数据桥所 不可避免的。图1是有4个节点的点对点元数据互 连体系结构图。 图l 点对点元数据互连体系结构 Fig.1 The point to point metadata interlink architecture 2)集中式元数据互连体系结构 集中式元数据互连体系结构引入r 1个元数据 存储库,元数据存储库存储本身的通用元数据模型和 集成系统中每个元数据源的元数据定义和格式。每 个元数据源只要建立和元数据存储库的连接,以及本 地元数据和元数据存储库通用元数据的映射转换,就 可以实现和全局元数据源之问互通。元数据源要实 现本地元数据到存储库通用元数据的映射。元数据 源从元数据存储库获得元数据,而不是从元数据源获 得。图2是集中式元数据互连体系结构图。 3)分布式元数据互连体系结构 分布式元数据互连体系结构¨ 的基础是集中式 互连,共有2种形式,一种是用元数据桥联通各个元 数据存储库,实现元数据的共享和重用。每个元数据 存储库负责各自领域内的元数据源。不同领域内的 元数据源通过元数据存储库之问的元数据桥来实现 互通。这种互连方式适用于存储库不多的情况,主要 用于合并2个不同通用元数据的业务领域。另一种 是采用树形结构,创建根节点作为根元数据存储库, 将各个元数据存储库作为子节点,根节点负责各个尢 数据存储库之间的元数据互通。每个子节点元数据 存储库负责其子节点的元数据源。元数据源通过其 父节点来获得其他元数据源的元数据,如果2个元数 据源不属于同1个父节点,则父节点通过根元数据存 储库来实现元数据互通。图3和图4分别列出r这 2种互连体系结构图。 图3 元数据桥方式分布式元数据互连体系结构 Fig.3 The metadata bridge distribution metadata interlink architecnlre 《 图4根存储库方式分布式元数据互连体系结构 Fig.4 The root node storage distribution metadata interlink architecture 点对点元数据集成体系结构中,各个元数据源通 过元数据桥连接。元数据桥既负责传输元数据,又要 对异构的元数据进行转换。集中式元数据体系结构, 元数据源只需要和元数据存储库进行元数据传输和 增刊 赵文涛,等:元数据技术研究 ・91・ 转换。 综合考虑不同元数据集成体系结构,点对点结构 的缺点是元数据桥的维护代价高和重用性差,但不需 要额外的存储库。而集中式结构,创建代价低,易于 扩展,但需要额外的存储库,存储成本高。 4.2元数据生命周期体系结构 元数据生命周期体系结构定义了元数据集成体 系结构中元数据流和行为特性。元数据生命周期由 如下活动组成:创作,发布,拥有,消费,管理。 创作指创建新的元数据。发布指让整个环境或 环境中对此感兴趣的部分知道元数据的存在和位置。 拥有指某个特定的工具或过程声明关于如何使用1 个元数据块的权限。消费指工具读取元数据并为某 种目的使用元数据的行为。管理指对整个元数据的 管理和控制,包括修改和扩展元数据,以及控制其他 工具或过程对它的访问。 与元数据生命周期活动相对应的是元数据生命 周期角色:作者,发布者,所有者,消费者,管理者。每 个角色描述了1个特定软件工具(或者软件工具类 型)通常是如何在特定的元数据集成体系结构中发 挥作用的。特定的软件产品和工具可能在不同的时 刻扮演不同的角色。在很多情况下,角色是交叠的。 图5是集中式生命周期体系结构。 OLAP服务器 作者 消费者 /——\ /——、、 可操作的 关系型数据 数据存储器 霪嚣I 库服务器 管理者I L——— 一 存储库 消费者,作者 消费者 /——\I , ——、 建模工具 报告工具 ETL工具 消费者,作者 图5集中式生命周期体系结构 Fig.5 The centralization lifecycle architecture 5 元数据应用框架 元数据应用工程指建立相应的应用规则和流程 来有序、有效、可靠和可持续地编制与应用元数据的 过程。图6描述了元数据应用工程的基本框架 。 元数据选择主要是选择元数据的内容格式、应用 图6元数据应用工程框架 Fig.6 The metadata application project framework 规范和格式语言。选择时主要的考虑因素有自行创 建还是选择已有格式、元数据要描述的资源内容、元 数据格式的应用功能和元数据格式的候选格式等。 元数据挖掘是直接从所描述的资源内容中挖掘 出相应的数据作为元数据元素,建立元数据记录。主 要有基于元数据复用的挖掘、基于XML DTD的挖 掘、基于概念集的挖掘、基于词语分析的挖掘和基于 自动数据赋值的挖掘。 元数据应用的重要特点是开放性和规范性,元数 据应用体系要建立规范文件或说明,并且要保证这些 规范文件或说明可查询和可获得。 6 结 语 元数据作为对信息内容规范描述、发现和检索的 工具,在各个领域信息共享方面发挥着关键的作用。 本文对元数据定义、元数据标准、元数据互操作、元数 据集成体系结构和元数据应用工程框架等方面进行 了分析研究。对常见元数据标准的特点和适用范围 进行了比较分析,给出4种实现元数据互操作的关键 技术,分析比较了元数据集成的体系结构,并且阐述 了元数据应用的一般框架。 参考文献: [1] Baidu.Metadata[EB/OL].http://baike.baidu.corn/view/ 107838.htm,2010—03—10. [2]Department of Defense.Net—Centrie Data Strategy[Z]. Washington D.C.:DoD,2003. (下转第99页) 增刊 王 萌:水面舰艇编队电磁兼容管理系统方案初步研究 ・99・ 针对难以通过技术手段规避的电磁干扰问题,需 管理措施对作战使用的影响,并提出编队内信息共 享、功能互补地辅助措施,以避免英阿马岛战争中 “谢菲尔德”号悲剧的发生。 要根据当前作战使命任务,分析各设备的重要度,提 出作战使用建议,经指控或编指,由编队指挥员或者 舰长人工决策。 由于我国编队电磁兼容技术研究起步晚、基础 差,编队电磁兼容管理控制系统研究还需要开展大量 工作,但是突破上述3条关键技术,则可大大提高编 3 编队电磁兼容管理控制系统关键技术 编队电磁兼容管理控制系统技术新,技术难度 大,需要在以下几个方面着力开展工作,突破相关关 键技术。 1)编队电磁干扰态势分析判断技术。需要深入 队电磁兼容管理控制系统研制的技术成熟度,降低技 术风险。 4 结 语 本文初步提出编队电磁兼容管理控制系统的组 成,分析各模块的功能及工作流程,旨在抛砖引玉,为 研究能快速判断编队内设备是否存在相互干扰的关 键技术,使得编队电磁兼容管理控制系统能把握整个 编队的电磁干扰态势。 研制编队电磁兼容管理控制系统提供参考和借鉴。 参考文献: [1] 水面舰艇编队电磁兼容研究探讨[A]水面舰艇电磁兼 容技术研讨会会议资料汇编[C],2008.3—11. [2] 匡远波.复杂电磁环境下海军舰艇电磁兼容技术的发展 2)电磁环境监测技术。监测整个海域的电磁环 境,并甄别判断其电磁信号是否来自编队自身、所处 区域、是否构成潜在干扰,为调整编队管理方案提供 支撑。 3)辅助决策技术。对于难以采用频域、空域等 管理措施规避,必须采取大分时管理的电磁干扰问 题,研究提出基于作战使用的辅助决策建议,分析该 思路[A].水面舰艇电磁兼容技术研讨会会议资料汇编 [C],2008.20—26. (上接第91页) [7] CCC.TEI Guidelines for Electronic Text Encoding and Interchange[EB/OL].http://www.tei—c.org/ Guidelines/.2011—02—01. 参考文献: [3] 张晓林.元数据研究与应用[z].北京:北京图书馆出版 社,2002. [8] EDITEUR.ONIX Product Information Guidelines[E B/ OL].http://www.editeur.org,2001—07. [9]DLF.The Making of America II Tested Project Whirr Paper Version 2.0[EB/OL].http://sunsite.berkeley.edu/Inoa 2/wp—v2.html,1995. [4] 毕强,朱亚玲.元数据标准及其互操作研究[J].情报理 论与实践,2007,30(5):660—670. BI Qiang,ZHU Ya—ling.Research on metadata standard and its interoperability[J].Information Studies:Theory& Application,2007,30(5):660—670. [1O]Department of Commerce.Application Protile for the Government Information Locator Service(GILS)f EB/OL] http://www.gils.net/prof_[5] 王翠茹,高丽鲜.元数据集成体系结构的研究[A].计算 机应用及其他——2009全用计算机网络与通信学术会 议论文集[C].保定:华北电力大学出版社,20o9.296— 30o. v[2]html,1997—1 1—24. [1 1]FGDC.Content Standard for Digital Geospatial Metadata [EB/OL].http://www.fgdc.gov/metadata/constan. htm1.2011—02—01. [6]DCMI.Dublin Core Metadata Element Set[EB/OL]. http://dublincore. 2O08—01—04. org/doeuments/2008/01/14/dees/, [12]LOC.EAD Home page[EB/OL].http://lcwed.1oc. gov/ead/eadhome.htm1.2011一O2一O1. 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 69lv.com 版权所有 湘ICP备2023021910号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务