Equipment Manufaetring Technology No.6,2012 语义网格本体论技术在网络精确搜索方法探析 黄丽芬 (广西工业职业技术学院建筑工程系,广西南宁530001) 摘要:通过研究P2P网络搜索引擎模式的GnuteUa协议,结合语义本体技术,利用节点逻辑构造及节点问语义希哈路由 袁实现问题关系变换的语义网格本体论方法,用“问一答”式查询模式实现精细、准确和自动化的网络资源的深度搜索。 关键词:语义本体论;网络资源;精确搜索 中图分类号:TP391.3 文献标识码:B 文章编号:1 672—545X(201 2)06-0072-03 信息技术的飞速发展,为人们提供了广阔的共 种机器可处理的方式来描述,其目标是实现语义与 享平台,网络检索已经成为人们获取信息的常用渠 机器智能的互操作性。 道,人们通过信息检索工具来检索相关的信息,这在 1.2 Gnutella协议 一定程度上解决了资源的分类和检索问题。然而,传 Gnutella协议是一份关于发布检索的P2P协议, 统的基于关键词的检索方式,由于忽视了关键词本 用于完全分散化的资源搜索,该协议定义了客户机 身所蕴含的语义信息,而得到较低的查全率和查准 通过网络通讯的方式,包括通过客户机进行数据通 率,变得越来越不适应检索的要求。 讯的描述符号集和内部客户机相互交互的一些规 语义网格本体论技术,为信息检索提供了一种 则。虽然Gnutella协议也支持传统的客户端,中心服 新的方法。本文结合Ontology技术,利用节点逻辑构 务器的检索规范,但Gnutella协议更主要是支持点对 造及节点间语用关系变换的相关语义网格本体论方 点的,没有中心的检索,每一台Gnutella客户机正常 法对网络信息的精确、智能检索方式进行研究,实现 情况下即能执行服务器任务,为客户端提供服务器 快速为海量文本信息建立分类目录有效地组织网上 接口,使用户可以向服务器发出查询请求和看检索 海量信息,在检系统中扩展用户的检索需求以理解 结果;同时自身也能接收来自其他客户机的请求,检 用户真正的检索意图,在语义网格平台上,把检索需 查他们与自己的数据中匹配的部分,查询检索可用 求定位到合适的数据源中执行检索服务,从而进一 的结果。执行GnuteUa协议的网络能高度容错,即当 步提高查准率与查全率,以实现网格资源精确搜索, 任何客户机离线时,网络服务都不会被中断。 有效利用网络信息资源,消除资源孤岛。 1.3 Gnutella—Flooding搜索技术 Gnutella—Flooding搜索技术比较简单,不用对维 1相关技术 护网络的拓扑结构和相关的路由进行计算,仅要求 将接收到信息的节点以广播方式转发到各数据包。 1.1语义本体论 例如,源节点希望发送一段数据给目标节点,源节点 语义本体论,是语义网格理论的基础,即编制者 首先通过网络将数据副本传送给其每个邻居节点, 把一整套对某一领域中的表述的词和术语组成等级 每个邻居节点再将数据传送给各自的除发送数据来 条目,同时规定条目的特性及其之间的关系,这些词 的节点之外的其他。如此继续下去,直到数据传送目 和术语被称为元数据,语义本体也可以看作是计算 标节点或者数据设定的生存期限为0为止。 机机器用于识别语义的词典或辞海。语义网格使用 Gnutella—Flooding搜索技术的特点是: 元数据来描述网格中的信息,对信息和服务进行了 (1)简单,无需维护,局部节点失效不影响系统 很好的定义,可以更好地让计算机和人们协同工作, 性能; 其关键之处,就是把所有的资源,包括服务,都用一 (2)效率高,延时小,总是走最短最快的路径; 收稿日期:2012—03—07 作者简介:黄丽芬(1978一),女,广东普宁人,工程师,讲师,工学硕士学位,主要研究领域为计算机网络及信息处理。 72 《装备制造技术}2012年第6期 (3)基本操作是Flooding式广播,P2P直接通信; 论——源描述框架(Resource Description Framework, 同时添加语义哈希资源表,修改哈希路由表。 (4)缺点是存在大量富余联接,增加网络交通流 RDF),哈希路由表仍然包括原有P2P关键字查询方式 量,大量消耗网络宽带,直接影响并了网络的可 节点的IP、Port以及具体的共享资源,只不过新引入 扩展性能。 了目前已经被成熟使用的一种语义本体论(库)及语 而资源表是用“问题一答案”方 lfooding技术及其改进方法,都是基于“关键字”的搜 义希哈共享资源表,索技术,无法解决用户查询时出现毫不相关的“结 式的自然语义表达的,而且其中每一个答案与问题 搜索路径中的上一个问题,有明确的被包含关系。 果”的问题。 所有的P2P系统的查询技术,包括Gnutella的 2语义哈希路由表 如何高效而精确地在Intemet上找到用户真正 2.需要的答案,只有通过使用语义本体论才能最终解 语义搜索网络中大量使用语义哈希表,因为语 决问题。 2 语义本体论搜索方法 本文中的语义本体论搜索方法,是通过对P2P 网络系统中Gnutella协议的Flooding方法进行简单 改造,利用基于节点的局部语义本体论技术,改善 Gnutella—flooding方法存在的缺陷,达到用户精确查 询的目的。 2.1方法的节点逻辑结构 语义本体论搜索方法认为,网络资源是人们用 来解决某个具体问题的信息集合体,巨大的网络集 群中,包括足够解决任何问题的资源,而语义本体论 是用来实现查找这些资源的组织方法;而且这种组 织方法,是根据中国人的思维习惯及认知过程进行 设计的方法,即语义本体论(库)深刻揭示了网络资 源之间的内在联系。 本文在原有P2P网络关键字搜索方式的逻辑结 构的基础上进行改造,设计出如图1所示的语义本 体论搜索逻辑结构图。 图1 语义本体论搜索逻辑结构图 如图1所示的语义本体论搜索方法定义的节点 逻辑里,保持原有P2P方式下关键字查询方式节点 的共享资源库不变,把原有接受查询的关键字处理 模块替换为语义本体论模块,本文中具体语义本体 库采用一种目前已经编好的语义本体语义本体 义网络资源中“问题一答案”的查询过程,是利用语 义哈希表的用户节点中所包含语义本体论具体解决 问题的答案来实现,语义搜索网络“查询问题论”的 语义哈希路由表结构如表1所示。 表1 语义哈希路由表结构表 性能评价 记录号 查询问题 通信方式 邻居节点 、/ I 具体问题 明码 节点1 2 具体问题 明码 节点2 、/ 3 具体问题 明码 节点3 、/ 具体问题 MD 节点i 表1是一个(问题,通信方式,节点)映射对应表, 并且设计有对回答的问题性能评价的判断,其中节点 包含IP、Pot以及具体的共享资源描述等信息。也就 是说,每一个节点就是引用本体库中某一个详细答案 的地址及信息,是具有精确地解决某一问题的能力 的;通信方式有明码及加密两种方式,可以根据节点 要求提供的加密方法,如上表中与节点i的通信要求 MD5加密,可能是因为该问题是具有保密价值,要保 护其通信内容不被物理链路或传输层侦听到。 哈希路由表的管理,包括表的增加与删除。 (1)路由表的增加。当逻辑节点中收到带有节点 能力描述的Ping指令时,就发一个pong指令回答, 并查询其沟通通信方式是否需要加密以及加密方式 等,然后检查其是否真正具有其所申明的节点能力, 检查通过后,就加入路由表,同时向所有的其他邻居 节点立即发能力增强通知(也可以后通知)。 (2)路由表的删除。基本上用时间策略,即长期 不用的,或长期联系不上的,或确信不再需要其能力 的,就可以删除,但为了维持节点能力的稳定性,节 点哈希路由表不应当频繁变化。 2.3搜索方式对Gnutella—flooding协议的改进 P2P网络中Gnutella-flooding协议中因机器和网 络性能的原因,不能维护容量很大的路由表,否则 73 Equipment Manufactring Technology No.6,2012 flooding消息会很多,会造成大量的搜索冗余,同时没 基础上,利用语义本体论搜索方法的理论,通过采用 有判断搜索答案与问题之间关系的功能。 目前已经较成熟运用的语义本体库——资源描述框 语义本体论搜索利用Gnutella-flooding协议的 架,结合语义哈希路由表技术,通过问题在网络中的 查询方式,通过把其路由表改进成为哈希路由表,引 遍历查询,从路由表提供的节点从共享资源库搜索 入语义本体库,形成一个可以维护尽可能大而有效 出精确答案,实现本体论及Petri网络相互结合达到 的路由表,以维持自己的足够强大的查询能力,且不 有效地组织网上海量信息,在检系统中扩展用户的 存在flooding消息泛滥问题。因为每个节点是在庞大 检索需求以理解用户真正的检索意图,实现精确搜 的路由表中环环相扣选择路由的,真正发出查询消 索的目的。 息的可能就一条,就可以在路由表中选择出与之相 匹配的答案。 参考文献: 节点语义本体论把对节点能力的查询,即 [1]Can F,Nuray R,Sevdik A B.Automatic performance evaluaiton Query,通过哈希路由表传递给下一节点,即Query— ofWeb search engines叨.Information Processing Management, i+1,实现了问题在网络中的遍历查询,Query的遍历 2004,(3):42-43. 过程,也是问题的求精过程,用户将获得逐步精确的 【2】LU Shi-yong,DONG Ming,Farshad Fotouh I.The Semantic Web:Opportunities and challenges for next-generation Web 答案,从而解决用户的一系列由浅人深的领域相关 apphcafions叨.International Journal of Information Research, 问题。 2002,(4):87-89. 【3]中国互联网络信息中心.第十四次中国互联网络发展状况 3 结束语 统计报告【RI.2004,7//http:llwww.cnnic.net.ca [4]吴丹.搜索引擎的智能化研究【J].情报理论与实践,2002, 本文在P2P网络Gnutella—flooding搜索技术的 (4):293-295. The Research of Semantic Grid Ontology Technology in Network Accurate Search Method HUANG Li—fen (Architecture Engineering Department,Guangxi Vocational and Technical Institute of lndustry, Nanning 530001,China) Abstract:Through the study of P2P network search engine mode Gnutella protocol,combined wiht semantic ontology technology,using the node logic structure and node semantic Syrah routing table implementation problem of transformation between semantic snd ontology method,using “ask—answer to"inquiyr mode to realize the precise, accurate and automated cyber source depth search. Key words:semantic ontology;cyber source;exact search (上接第68页) Application of CC LINK BUS in Tread Extruder Control System TANG Guo-qing,SONG Xina-bin (1.Guilin Jianda Mechanical&Electircal Engineering Co.,Ltd.,Guilin Guangxi 541003,China; 2.Hangzhou Zhongce Rubber Co.,Ltd.,Hangzhou 3 10008,China) Abstract:This paper is an introduction to the method of using CC LINK open field BUS technology to form an automatie control system which controls tread extruder in tire factories.This method allows all the remote modules and drives in the control system to communicate wiht hte CPU module in hte Master Q-series PLC in high speed information exchange,thus meeting the requirement of producfion process contro1. Key words:CC LINK;PLC;tread extruder 74