您好,欢迎来到六九路网。
搜索
您的当前位置:首页人文社科大数据研究现状综述

人文社科大数据研究现状综述

来源:六九路网


人文社科大数据研究现状综述

前言

数据的历史与人类的历史一样久长。步入现代社会以来,伴随信息载体、种类和数量的增多,数据种类越来越丰富,数字、文字、图像、音频、视频等也都是数据。通过数据来研究规律、发现规律,贯穿了人类社会发展的始终。不仅人类自然科学发展史上的不少进步都和数据采集分析直接相关,而且人文社会科学的发展也始终离不开数据。自20世纪后期以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到了一个开始引发社会全面变革的程度。它不仅使世界充斥着比以往更多的信息,而且其增长速度也在加快。信息总量的变化还导致了信息形态的变化——量变引起了质变。大数据正产生于这一大的历史背景下。

大数据就是囊括了包括各方面信息的一个庞大的数据总和,其最核心的价值在于对海量数据进行存储和分析,并实现预测某一事物发展的趋向。相比起现有的其他技术而言,大数据的廉价、迅速、优化这三方面的综合成本是最低的。大数据最重要的是如何使用,最大的挑战在于哪些领域能更好地使用数据及大数据的应用情况如何。人文社科包含人文科学和社会科学,是一个非常广泛的领域,大数据逐渐成为其研究热点,尤其是在农业、医疗、金融、社会管理等方面得到了很好的应用,为社会的发展提供了很大的帮助。

工业以后,以文字为载体的信息量大约每十年翻一番;1970 年以后,信息量大约每三年就翻一番。到如今,全球信息总量每两年就可以翻一番。著名管理咨询公司麦肯锡称:“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于大数据的挖掘和运用,预示着新一波生产力增长和消费盈余浪潮的到来。”大数据无时无刻都在影响着我们的日常生活、国民经济、社会发展,受到社会各界的关注,如何利用这些海

量数据去解决社会生活中的问题,已经成为当前研究的热点。人文社科领域重在研究并阐述各种社会现象及其发展规律,随着现实社会中数据量的剧增,比如社会化媒体,包括微信、微博、网站等,已经渗透到人们生活的各个领域,开放的群体通信和群体互动已经成社会生活的重要组成部分。人文社科领域原有的研究方法已经无法有效地处理这些数据。在过去,人文社科领域的研究常常采取抽样问卷调查、座谈、访谈等方法采集数据。然而,再好、再合理的抽样方法,反映的总是对局部和部分人群、阶层的研究结果,随机偶然性较大,准确性欠佳。如今,大数据处理技术为其提供了新的思想和方法。通过各个平台或网站的并联进行进一步分析,开展思想动态研究、行为方式分析、生活方式探索,发展趋势预测,乃至可以替代传统意义上的问卷调查而进行大规模的数据分析。通过大数据的这些相关技术挖掘社会化数据中隐藏的信息,揭示社会现象并为社会问题提供可靠的解决方案,解决了人文社科领域传统方法无法有效处理的问题。随着大数据研究的发展,大数据在人文社科领域已经有了很多较为典型的应用,特别是在农业、医疗、金融、社会管理等行业。

大数据是知识经济时代的战略高地,是国家和全球的新型战略资源。作为思维的性创新,大数据为科学研究带来了新的方。**总在谈到如何繁荣发展中国特色哲学社会科学时,要求我们善于“运用互联网和大数据技术,加强哲学社会科学图书文献、网络、数据库等基础设施和信息化建设”,这为信息化时代的人文社会科学研究的方式变革与理论创新指出了正确的方向。大数据正在成为当前中国社会快速信息化的最重要表征之一。我们应当深刻认识大数据及其对人文社会科学研究所提供的机会与挑战,自觉促进人文社会科学研究的变革与创新。

一、大数据的特性及其热点研究

大数据的基本特征(沈浩、黄晓兰)

1.多带来不同,大数据具有的最显著特征之一就是多带来不同。2.社交网络数据源,大数据真正的兴奋点来自于社交网络,特别是国外的Facebook 和Twitter,国内近年来兴起的微博,特别是新浪微博这个具有媒介属性的社会化媒体,每天每秒都在产生亿级的文本话语。3.开放性公开易获得,大数据的开放性和公开易获得是大数据兴奋的另一重要特点,大数据的产生并非是为了分析去存储,而是商业过程自动化会产生并存储下来。4.重预测爱,社会预测是大数据的重要特征。5.重发现非实证,传统的实证研究,强调在理论的前提下建立假设,收集数据,证伪理论的适用性,采用随机抽样的定量调查问卷获取数据,验证假设,你不问的问题被访者也不会回答。6.重关系非因果,大数据重关系而不关心因果,问什么而不问为什么是另一个重要特征。7.重全体轻抽样,大数据是商业自动化存储的数据,在软硬件满足的条件下可以分析海量数据。8.非结构化数据,数据挖掘是要发现那些先前未知、实用、有效的信息和知识,往往更多来自非结构化数据,这是大数据时代的更为显著的特征。

大数据的特点(崔晓晖、王志波、杨威)

1.重发现非实证。2.重关系非因果。3.重预测而应用偏重于社会。

由于大数据所具有的特征,大数据研究并非易事,其难点主要体现在以下三个方面。首先,传统的存储结构需要升级为扩展性的存储架构,否则无法适应现有的大数据存储,同时,对于分布式的文件系统,需要进行实时的流处理,而“传统的数据分析更多的是结构化,数据量是有限的,集中式处理、批量处理,也无法满足需要”。其次,没有速度,再有价值的大数据也只能是一堆无法流通的钞票。凭藉传统的数据分析能力,无法处理这么大量的数据。最后,由于分析手段的,取样时的样本数不够大,不能充分利用所有的数据,无形中破坏了信息的完整性;由于受限于分析能力而无法获取复杂问题的答案;由于受限于时间而不得不采用某项简单的建模技术,同样,也是由于没有足够的时间来执行

多次迭代,不得不对模型净度进行妥协。可见,大数据在人文社科领域的研究还在发展阶段,还需要继续研究新的处理方法和思想,为该学科的发展提供新的动力,并应用到现实以推动社会的发展。

人文社会科学大数据研究的基本特征(孙建军)

综合已有的研究,人文社会科学的大数据研究具有如下基本特征:

1.所涉及资料均大大超过一般的阅读、分析和理解所能处理的范畴,是以往“不可研究”或“难以研究”的,大数据分析方法的出现提供了人文社会科学研究新的研究空间,提供了新的研究可能。

2.一般引入计算分析方法,其结论并非观察、思索、领悟等传统方法获得,而是通过大量数据的汇集而“自动涌现”,其理论的获得不同于传统人文社会科学研究。

3.均构建了可持续完善和丰富的数据集和分析工具,其可用性、共享性、重用性、协作性大大增强,提供了人文社会科学学者大规模协作的可能。

4.均具有跨学科特征。数字人文研究需要汇集专业领域技能、数据管理技能、数据分析技能和项目协作技能,因而这类项目往往由跨度较大的不同学科的专业学者共同完成。

5.决定研究质量的主要是数据集的质量、数量和利用方式,而研究假设相对容易。在某种程度上,数据科学家将成为人文社会科学大数据研究中的主角。

大数据研究热点解析(赵蓉英、魏绪秋)

1.大数据时代图书馆资源与服务有待变革图书馆是知识的集中和发源地,而知识来源于数据。

2.大数据时代国家治理能力有待提高数。

3.大数据时代企业竞争情报工作急需加强。

4.大数据时代数据人才急需储备。

5.大数据时代现有数据技术有待发展。

6.大数据时代数据挖掘与处理变得尤为重要。

7.大数据时代信息服务有待完善。

8.大数据时代信息安全观念有待树立。

9.大数据与互联网息息相关。

大数据对于社会学的影响:网络时代的社会学(韩蒙、向伟)

社会学并不具有哲学那样高深的气质,也没有历史那样的气度,但是它位于社会科学之中,是社会科学这一领域的重要支柱。在这里我就不费篇幅去讲解社会科学的兴起历史,只强调一点,社会科学成为人类知识的一个领域之后,一直在以科学——主要是自然科学——作为其学科建设发展的目标。这一点野心,在社会科学要自称为科学就能看出来。我们以如今位列社会科学当中的经济学、政治学、社会学的各自对自己学科的期待就可见一

斑。经济学,需要研究人类社会经济现象的运行规律;而政治学,则追求对于人类社会的政治运作规律进行解释;同样的,社会学通过经验来总结社会的规律,比如社会机制。尽管早期的社会学也主要是依赖于理论演绎的研究方式,但是在自身的发展过程当中,逐渐形成了一套以统计思想为技术基础的处理经验材料的研究方法。而随着统计思想的演进,这一套研究方法也经历了从归纳统计到推论统计的变化。由于统计方法的发展,社会学内部由于方法上的分野,也出现了基于方法即方的差异,出现的两种研究取向,即所谓的定性社会学与定量社会学的区分。基于假设检验、统计推断的社会学研究依赖定量方法;而难以被统计学检验的数据的社会学研究常常采用定性方法来进行研究,这样的研究注重从资料收集出发来建构理论,因此其研究逻辑类似于归纳的思想。

大数据条件下的人文社会科学教学方法创新(陈仲)

一是注重“以问题为中心”,“教师是主导,学生是主体”之诠释。二是注重传授“方法的知识”,“授之以鱼不如授之以渔”的追问。

大数据给大学尤其是人文社会科学的教学改革带来了极大挑战,同时也为教学方法的创新带来了机遇。大数据不仅仅是一种资源,而且是一种工具,更体现为洞察复杂事物的一种思维方式。这种思维方式强调数据的“代表性”而非“精准性”、强调“相关关系”而非“因果关系”、强调数据的“量”而非“杂”。这种思维方式主要是指“大时间”、“大空间”、“关联性”、“立体化”思维,“大时间”是指人们在看问题时,不能只局限于“当下”,而更应具有历史眼光和前瞻性视界;“大空间”是指人们在看问题时,不能只局限于某个狭小的“场域”,而更应该具有全球化视野;“关联性”是指人们在看问题时,不能孤立看待某个问题,而更应该树立联系发展的观点;“立体化”是指人们在看问题时,不能单向度地看待某个问题,而更应该具有多个维度。因此,大数据思维必须应用到人文社会科学的教学之中。如果说,教学是一门艺术,那么,这门艺术更多地体现在教学方法层面。教学方

法是衡量教师教学水平高低的重要指标,优秀教师一定有一套让学生喜欢的教学方法。如果在大数据条件下,不转变教学观念,改进教学方法,教师难以优秀甚至难以生存。

二、大数据之于人文社科成果评价的价值

大数据时代人文社科成果评价变革的主要内容(蒋玲、杨红艳)

一是从随机样本到全样本,二是从精确性到混杂性,三是从因果关系到相关关系,并由此衍生出更多的新变化。大数据时展人文社科学术成果评价的变革,很有可能减轻甚至解决当前评价中的许多棘手问题,得出更为准确、可信、及时的评价结论,进而为人文社会科学带来前所未有的发展面貌。但是我们要认识到,仅针对个别评价要素开展的局部人文社会科成果评价变革很难奏效,因为大数据提供的变革思路是崭新的,必须从人文社科成果评价机制着手推进变革才有可能使变革落到实处。同时也不能盲目拥抱大数据时代,走向“ 用量化手段代替一切评价”的极端,辩证地认识大数据时代评价结论的相对性,警惕风险、扎实推进,是确保人文社科学术成果评价变革取得成功的关键。

大数据对人文社科成果评价的不足(蒋玲、施立红、苗林)

评价和了解研究人员的学术研究成果,可以为后续学术质量的提升及规划发展提供参考依据,并以此来激励研究人员进一步提高其学术研究的质量。长期以来,人们在此方面一直是以定性的方法为主,强调同行互评,并辅之以书目等成果计量方式的定量方法,目前定性与同行互评仍位居学术评价的主流地位。同行互评的缺陷在于无法排除评价者的主观影响,评价者本身的学术积累、知识领域和学术观点等都会对被评价者造成一定的影响。计量方式只是对其所发表的出版物进行计量,无法真正计算学术成果所带来的社会影响力。大数据的出现使得这些原本难以解决的难题迎刃而解。大数据主要的功能之一就是预测。

人文社会科学科研成果的影响力可能是长时间的,在短时间内无法通过有限的数据真正反映其价值,大数据的预测使其成为可能,并大幅缩减评价时间和评价成本,将控制评价的主观随意性减到最低。当然,在人文社会科学科研成果中采用大数据评价方法也存在很多障碍。如牵头机构、数据整合、学者意识、推广宣传等,以及改变现有人文社科学术评价的固有理念,使之向大数据转移,也是一大难点。辩证地认识大数据时代评价结论的相对性,是确保评价变革成果的关键。大数据时代评价结论具有相对的正确性,但不能将大数据的评价结论等同于精确结论。因为数据可能是全面的,但人对大数据的掌控力度有限,不可能完全把握。大数据的评价结论也可能出错,因此不能将大数据时代的评价“神化”“万能化”。首先,我们并不能通过大数据预测出创新的成果一定会成为热点。如果过度依赖大数据的结果,科研成果反而会受到分析结果的压制;同时,分析和评价也需要同行专家的经验进行补充。其次,大数据因为信息的过于庞大而允许信息的不准确性,但却无法估算多少信息是不真实的,因而存在着大量的“脏数据”带来的隐患;最后,大数据存在着个人隐私安全的问题,庞大的信息记录着个人兴趣、经历、联系方式等信息,对个人隐私的安全带来威胁。

三、大数据之于人文社科研究的发展情况

人文社会科学研究应自觉融入大数据时代(欧阳康)

大数据时代已经来临。美国于1993 年启动信息高速公路建设,2012 年3 月又宣布投入2 万亿美元用于“大数据研究和发展计划”,着力于保持在大数据战略方面的世界优先地位。我国在2015 年8 月发布了《促进大数据发展行动纲要》,将大数据纳入国家战略。目前的问题是,人文社会科学工作者如何自觉地进入大数据时代,推进人文社会科学研究的变革与创新。一要要自觉学习和有效运用复杂性思维。二要要自觉学习和运用大数据技术。三要要自觉更新和发展自我。

辩证认识大数据对于重构人文社科研究范式的作用(陈泓茹、赵宁、汪伟)

大数据既可以说是信息时代的新标识,也可以说是代表了一种新的战略、技术和方法。以2015 年9月5日印发《促进大数据发展行动纲要》为标志,大数据在实践中已经上升为国家战略。但迄今为止的大数据应用范围更多的还是停留在经济社会和治理等具体工作领域,人文社科研究实效性不高的顽疾能否通过主动对接这场数据、敏锐抓住机遇、实现数据转向而得到缓解甚至破解是一个值得讨论的重大课题。

第一,充分肯定大数据对于人文社科研究的积极意义是基础。第二,深刻认识人文社科研究方的特殊性是前提。第三,准确界定大数据的作用方式和领域是关键。第四,厘清大数据之于人文社科研究的作用边界是保障。

人文社会科学研究的数据挑战(孙建军)

其一,科研资料总量的快速增加给人文社会科学学者带来了巨大挑战。其二,资料的数字化改变了传统人文社会科学的资料类型,数字资源的采集、加工和处理对研究成果的获得作用日益显著。

人文社会科学大数据研究目前还面临 4 个方面的问题。(郭华东)

统计学的抽样调查是经典的社会学统计分析方法,但随着大数据时代的到来,人们获得全体数据已经不是不可能的了,因为先进的多核计算机可以在短时间内分析完成庞大而繁杂的数据[11]。所以,我们可以利用大数据分析以前所难以评价的结果。在人文社会学科研成果的评价方法当中,经验性和结果性评价仍为主流,大数据虽然为人文社科学术评价的变革提供了新的机遇,我们应好好把握,但也不能盲目地拥抱“大数据时代”,走向“用

量化手段代替一切评价”的极端,应警惕这种评价变革可能带来的风险,扎实推进评价改革。

1.科研资料总量的快速增加和数据质量问题给人文社会科学研究带来了巨大挑战。当前人文社会科学研究者在各自研究领域都面临大量数据资料的处理问题[8],研究范式的转变也使得人文社会科学研究越来越依赖高质量的数据,迫切需要构建人文社会科学数据的质量保障机制,以及研究新的计算机处理模式和分析方法以支持人文社会领域科学家对知识的获取、标注、比较、取样、阐释与表现。

2.资料数字化带来的挑战。资料数字化改变了传统人文社会科学的资料类型,数字资源的采集、加工和处理对高水平研究成果的获得作用日益显著[8]。以“大数据”为代表的数据资源在数据粒度、碎片化、结构多元化、信息质量等方面具有更高的复杂度,对资料的汇集、保存和综合利用更加依赖计算机的辅助,人文社会科学家进行数据处理分析也越来越需要依赖信息技术手段,迫切需要开发可用于人文社会科学大数据采集、清洗、分析处理和可视化的工具和方法。传统人文社会科学学者对信息处理分析工具与技巧的缺失将影响该领域高水平研究成果的产出。

3.数据出版和共享方面的挑战。缺乏能够应用于大数据研究实践成果和学术著作快速出版的开放工具和平台,也是一个重要挑战。目前亟需可用于不同学科、不同制度下的数据出版(有适当标准和授信)和数据共享的集成化平台,以及多数据集成化出版。

人文社会科学大数据研究的隐忧和新思维(孙建军)

虽然以微软、谷歌、IBM 为代表的主流数据服务商都极力推崇数字化人文社会科学研究的美好前景,但其也存在不足:

首先,非场景化的研究逻辑缺乏适用性与人文关怀。由于完全剥离了数据所处的具体环境,数据可能生涩,并且缺乏可理解性和适用性。比如商业分析中的数据挖掘,其可用性仅10%左右,并非“一挖就灵”。2012 年,加拿大作家史蒂芬·马尔什在其文章《文学不是数据:反对数字人文》中也表示,将文学当作数据会失去文学本身丰富的意蕴。其次,人文社会科学的大数据研究有可能“敏锐地”发现问题,却无法给问题合理的解释,也无法给出有针对性的对策,了其应用范围。比如舆情分析、计算、情感计算的应用。再次,数据分析的集群研究会消灭重要的个体特征,而个体反而是众多人文社会科学研究关注的焦点。最后,人文社会科学大数据研究过分关注技术分析,可能忽视创新思维和思辨分析,不利于大师级人文社会科学学者的培养。

从当前数字人文和人文大数据研究情况看,人文及社会计算方法与人文社会科学研究的融合出现了三类新的研究思维:

其一,人文社会科学开放与全过程研究思维。其二,人文社会科学碎片化重组研究思维。其三,人文社会科学计算分析研究思维。

参考文献

[1]大数据对人文社科成果评价的价值研究,新世纪图书馆,期刊,蒋玲、施立红、苗林

[2]大数据融入人文社会科学的基本问题,学术论坛,期刊,陈泓茹、赵宁、汪伟

[3]大数据时代人文社会科学如何发展,光明日报,报纸,孙建军

[4]大数据时代人文社科成果评价变革探析,情报资料工作,期刊,蒋玲、杨红艳

[5]大数据时代中的人文社会科学挑战与机遇,内蒙古大学研究生学志,期刊,韩蒙、向伟

[6]大数据与人文社会科学教学方法革新,四川文理学院学报,期刊,陈仲

[7]大数据与人文社会科学研究的变革与创新,光明日报,报纸,欧阳康

[8]大数据在人文社科中的应用研究,社会科学报,报纸,崔晓晖、王志波、杨威

[9]大数据助力社会科学研究:挑战与创新,现代传播(中国传媒大学学报),期刊,沈浩、黄晓兰

[10]计量视角下的我国人文社会科学领域大数据研究热点挖掘与分析,情报杂志,期刊,赵蓉英、魏绪秋

[11]情报计量学视野下的当代人文社科发展背景描绘——一个人文社科领域数据密集型科学发现的探索性案例,情报资料工作,期刊,汤建民

[12]自然科学与人文科学大数据,中国科学院院刊,期刊,郭华东等

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 69lv.com 版权所有 湘ICP备2023021910号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务