搜索
您的当前位置:首页正文

Web2.0环境下的社会化搜索研究

来源:六九路网
20l0年9月 情报探索 第9期(总155期) Web2.0环境下的社会化搜索研究 陈 玉 (郑州大学信息管理系 河南摘关键词:Web2.0社会化搜索 搜索机制 聚类分析 中图分类号:G354.4 文献标识码:A 文章编号:1005—8095(2010)09-0109-03 450001) 要:介绍了社会化搜索的内涵、特征及搜索机制,并通过实例阐述了社会化搜索的具体应用。 1 引言 Web2.0的概念自2004年首次提出以来.便迅 速成为人们讨论和研究的热点,逐渐深入到人们日 常工作和生活的方方面面。受其影响.搜索引擎也将 其个性化理念引入,作为对传统搜索引擎缺陷的弥 补【”。 Web2.0为搜索引擎带来了一种新的文化,即 Web2.0文化。Web2.0文化是指人们在使用基于 Web2.0模式的各种互联网技术和服务的过程中.逐 渐建立起的以长尾理论、并行生产理论、六度分隔理 论和若连带优势理论为基础,以去中心化、多元化、 草根化、个性化、通俗化为特征,以平等、自由、开放、 共享、实用、创新、参与、宽容为核心理念构成的制度 规范、行为习惯、价值观念、审美情趣、思维方式等复 杂文化现象[2]。这种文化也正在导致搜索引擎用户 存返回的结果。 (3)public Record openWord(String wordPath)。 网络行为习惯的改变,基于Web2.0框架,社会化搜 索这个全新的概念走上前台。 2社会化搜索的内涵 《辞海》中对“社会”的定义是指“以共同的物质 生产活动为基础而相互联系的人类生活共同体。”而 “社会化”是指“个人参与社会生活,通过交互活动寻 得知识技能和行为规范。成为一个社会成员的过 程。”从这个层次上来讲,社会化搜索也正是网络用 户之间相互联系、通过一定的交互活动和知识共享 寻得所需信息的过程。 社会化搜索首先是为个人提供个性化的搜索。 并在搜索服务的基础上,帮用户建立社群,在社群内 共享彼此搜索的、收藏的、标注的、访问的内容。社会 化搜索基于搜索的社会性网络服务,通过搜索信息 的和访问记录等的社会性共享,从而建立起社交网 {boolean isOpen=true; try { app=new ActiveXComponent(” Word.Application”);//P=动W0一,生成JAVA COM Briase的ActiveXComponent对象 docs=app.getProperty(”Documents”). 方)都已经具有对JCA的支持。都按照JCA规范开 发适合自己的EIS适配器,而本文在采用J2EE连接 器实现COM组件的数据源和J2EE应用服务器集 成的过程中.实现了一个具体的资源适配器COMJ. CA,并在webSphere5.0上部署、测试,符合了JCA规 范的要求,同时保持了COMJCA在各个兼容JCA规 范的J2EE应用服务器之间的可移植性,从而使客户 端可以在一个支持并发连接的、安全的J2EE平台 上。通过标准接口CCI访问COM组件的数据源,也 为数字图书馆信息资源整合获取提供了一种可行的 途径。 参考文献 toDispatch();//获得document对象 doc=Dispatch.invoke(does,”Open”,Dis— patch.Method, new Object[]fwordPath,new Variant(false), new Varint(tarue)l,new int[1]).toDispatch();//打开 Word文件 wcontent:Dispatch.get(doc,”Content”). toDispatch();//取得word文件的内容,此时获得的 [1]李培.数字图书馆原理及应用[M].北京:高等教育 出版社。2004:189—191 [2]J2EE Connector Architecture Specification[EB/OL]. [2010-02-01].http:Pl,j8V ̄Lsun.comPconnector [3]DanAdler.JACOB document[EB/OL].[2010—02一 O1].http://jaeob2projeet.Sourceforge.net,2007. [4]唐国维,肖勇军.C0M中自动化对象的方法调用探 析[J].应用技术,2006,11(5):24_27 wcontent是Dispatch类型的JAVA对象。 nu=wcontent;//结果信息保存 } } 4结语 [5]Tim Francis,Eric Hemess,Rob High Jr.IBM Web— Sphere 5.0应用服务器编程指南[M].王琚,译.北京:电子工 目前,大多数的EIS供应商(也就是数据源提供 业出版社,2003 109 2010年9月 情报探索 第9期(总155期) 络关系,再进而引入社群/用户组的Webmarks、Tags、 Webcache等个性化信息对用户再检索提供较好的 参照或范围。而且它还能在你的搜索结果前面直接 插入你的访问历史记录中跟关联词相关的几条结 果,跟Google的History的表现方式有点类似。同机 器搜索相比,其最大的特点就是人性化。 社会化搜索是以长尾理论和六度分割理论为基 础的:长尾理论强调的“汇聚”作用恰恰是社会化搜 索的本质所在:而六度分割理论则是社会化搜索建 立关系网络的基础,网站提供用户邀请和添加朋友、 结交朋友的朋友、利用短消息随时与朋友沟通、查看 评论等功能.进而使得网站中的人与人之间联系起 来,并在此基础上产生网站的聚合优势[3】。 3社会化搜索的特点 (1)用户参与和体验。社会化搜索不再只注重速 度和数量,而是通过Tag和RSS对内容进行筛选和 分类。在这个过程中,用户既是搜索引擎内容的使用 者,又是创造者,用户个人的体验和感觉成为影响搜 索引擎效果的关键因素。 (2)相关性更强,因为网页的相关度是由用户来 确定的,而不是由创造网页内容的作者或对网页进 行链接的网站管理员(Webmaster)来决定的。每个结 果都是经过用户选择的。同时也减少了网页的链接 结构带来的Spam的影响。 (3)用户可以发表对检索结果的看法,社会化搜 索充分发挥了用户之间、用户与搜索引擎之间的互 动性,达到对“微内容”的搜索.更好地满足了用户的 搜索需求。 (4)由于采用的是“公众的判断”,也就意味着网 页被一个或多个用户所认可和赞同,并且信息有价 值,值得他人分享。这种技术同仅仅由计算机算法来 分析网页相比,更具有进步性。 (5)网页之间的链接通过好友关系结构来实现, 主题的重要程度通过用户的兴趣与关注度来确定, 从而建立有别于传统算法排序的社会化排序。 PageRank(网页排名)主要是基于网站管理员们对链 接的重要性评定.而社会化排序则主要是依靠社区 用户的判断来进行的[4]。 (6)结果更流行更通用。因为社会化搜索引擎得 到的都是被用户集体关注的最新而且评论/反馈最 多的信息。 4社会化搜索机制 社会化搜索主要是由一个类似的元搜索引擎和 知识库组成,元搜索接受用户的查询要求Q,然后与 用户已定义的知识库中的资料进行匹配,进而选择 更加精确的搜索方式,然后将再定义后的查询要求 分配给一系列基本搜索引擎,各搜索引擎的结果R 需要再与知识库进行匹配选择,最后将通过聚类分 110 析后的合适的搜素结果R 反馈给用户(如图1) ]。 Q Q 圈1社会化搜索结构 由于存在用户自定义的知识库,所以社会化搜 索可以对搜索结果进行人工干预.同传统的以关键 词搜索相比,可以剔除大多数无用的信息,得到更多 用户想要的资料。另外,可以调用多个搜索引擎,在 结果信息上比传统的关键词搜索覆盖面更广。同时, 社会化搜索结果根据用户自己定义的知识库来进行 聚类分析和排序,其结果的精确度更高些[7]。 伴随着Web2.0技术的应用,个性化与互动性已 经成为用户在搜索信息时的大需求.用户希望通过 参与、交流,获得个性化、可信任的信息。这也是目前 的关键词搜索无法满足的,而社会化搜索则可以达 到这种民主。通过社会化搜索可以找到和自己有共 同兴趣主题的群体,可以形成好友圈,建立兴趣小 组,通过讨论、交流共同分享彼此的信息,为用户提 供了一个表达自己意愿的渠道[s-。 然而,社会化搜索也存在一些缺点:首先。对于 社会化搜索来说,涉及的主要是有用户感兴趣并能 形成群体的主题内容,对于那些颇专业、颇晦涩且不 被用户熟知的知识而言。可能只有少数人了解并需 要时,就不适合采用社会化搜索。其次,社会化搜索 毕竟是大众化搜索.用户通过建立兴趣小组,互相讨 论和交流来分享信息,此时的交流就变得生活化而 非学术化。另外,社会化搜索在内容分类方面也存在 缺陷,一般比较适合社会化搜索模式的内容多为能 引起人们兴趣和爱好的类别或与用户工作学习生活 相关度较大的类别.而冷门类别则不大受欢迎[9]。 综上所述.社会化搜索是在传统的关键词搜索 的基础上、在Web2.0理论与技术应用日益发展的背 景下产生并运用的。作为网络信息搜索的新方式,它 具有关键词搜索无法比拟的优势,但它并不能超越 或代替关键词搜索,它是传统搜索方式在新技术新 环境下的新发展,是对关键词搜索的补充。 5社会化搜索实例 5.1 美味书签网(De1.icio.us) 尽管De1.icio.US最基本的应用是在线存储和检 2010年9月 陈玉:Web2.0环境下的社会化搜索研究 第9期(总155期) 索书签,但它有一些特征使其成为一个搜索引擎,用 户通过创建标签来组织和记住书签的同时,De1.icio. US也对其他人感兴趣的书签进行链接。同时,标记活 动也允许用户对其他传统的关键术语进行链接。例 如,在关于“维生素E(Vitamin E)”的领域里,其相关 标签有“癌症(Cancer)”、“健康(Health)”、“营养(Nu— trifion)”、“药物(Medicine)”和“食物(Food)”等(如图 2)。通过社会化搜索,De1.icio.U8允许用户访问传统 搜索引擎(如Google)不容易访问到的深度网站,包 5.3 闪亮图片夹(Fhckr) Flick是一个广泛使用的对数码照片进行管理 和分享的网站(工具)。同其他的社会化搜索工具相 似。Flick允许用户使用任意的名词、动词和形容词 对图片进行标记,只要这些词对描述图片有用即可。 nick将用户的照片放在自己的服务器上.这样它们 可以通过任何的网络随时访问到。同Google的 PageRank(网页排名)不同,Fhckr对图片的排序主要 是基于用户对其喜爱程度以及对其发表的观点和看 括网上节目、播客、报纸和期刊文章,以及灰色文献。 另外,用户也可以向社区添加其所感兴趣的特定领 域的链接。这种链接,从本质上讲,也是具有社会性 的。与此同时,De1.icio.US还保持了一项传统搜索引 擎的特征,即对检索结果进行相关度排序。某链接被 使用的次数越多,在结果页面中其位置就越靠前[I叭。 法的多少的。这也可以看作是一种对Flickr上照片 受欢迎程度的测试.但兴趣是会随时间而改变的,今 天最受欢迎的明天或许就不是了,这也正是由社区 成员来决定其相关度的。 5.4 YouTube Searching Everybody‘s bookmarks for: !运垂 至一 — ::二 二二 二 二二 二 — : 一 二 璧霎嬖蠹磐§霪 《》 tu l l to sea rch y…。…b00k…ks ,.尽管YouTube是一个普遍流行的免费视频分享 网站。允许用户上传、观看和分享视频 片段,同时它也提供社会化搜索引擎的 功能。因为YouTube也具有标记的特 征,它会从用户使用相似关键字(标签) I【j v Ii{,l _lj cf1 li{jfII }“ 7. …的社区中产生结果。由于视频可以基于 用户的访问次数而排序.YouTube的搜 索结果实际上也是由用户社区来决定 的,从而为在线查找添加一项真正的 “社会性”因素。 参考文献 [1】何雪梅,黄学军.Web2.0及其搜索 初探[J].科技情报开发与经济,2OO7(17): 190—192 完毕 [2]Web2.0文化[EB/OL].[2009--03— 图2 Del icio.US书签链接 5.2谷歌定制搜索(Google Custom Search) 22].http://baike.baidu.corn/view/1111734.htm [3]赵中宁.社会化搜索模式的理论与实践研究[D]. 北京:清华大学。2006 Google提供了一个定制的搜索平台,同传统的 搜索引擎使用网络蜘蛛对海量网页进行爬行检索 (如Yahoo)不同,它是一种垂直搜索引擎。所谓垂直 搜索,有2层含义:一是满足用户特定需求的搜索; 二是针对用户对某一特定领域、某一特定人群或某 一[4]Social Search[EB/OL].[2009-03-25].http:Hen. [5]皿Freyne,thrry Smyth.An Experiment in Socila Search[J].Lecture notes in computer seienee,20O4(8).95—103 [6]万晓丹,李兆春.社会化搜索研究[J].科技信息:博 士・专家论坛。2007(33):38_4O 特定需求提供有一定价值的信息和相关服务。 使用Google的定制搜索引擎,任何人都可以创 [7] Jm Freyne,R0sta Farzan,Peter Brusilovsky,Barry Smyth,Mauriee Coyle.Collecting Community Wi ̄om:integrat・ 建一个“预定网站”集合,能够让人们选择其他的非 Google的垂直搜索引擎进行检索,并将其结果显示 在Google搜索的页面的顶端或代替其结果。另外。 用户也可以对网站设定优先级,赋予它们不同的权 值。同样,用户也可以对网站的页面风格进行设置, 可以将不同网页的风格整合到同一网页上.只要对 其搜索有帮助,或者让用户觉得舒适即可。其工具也 ngi ocSila Search&Social Navigation[J].International Confer- ence on Intelligent User Interfaces。2O0r7(1):28—31 [8] 李强.基于本体论的个性化和社会化元搜索引擎 的研究[D].杭州:浙江大学,2006 [9]Eugene Barsky,Allan Cho.Introducing Web 2.0:SO— cial search for health librarians[J].J Can Healh tLibr Assee, 20o7(2):58-61 是完全协作式的,允许创建者向其他人发送邀请共 同建造一个特定的搜索应用。并且Google还会提供 有用的统计数据,包括当前最受欢迎的搜索算法。 收稿日期:2o09—10—19 作者简介:陈玉(1985一),女,2008级研究生,研究方向为网 络资源管理与服务。 111 

因篇幅问题不能全部显示,请点此查看更多更全内容

Top