思勉思想节,斯坦福文理交融专业横空出世

作者:科技时代

技术改变人文:人文学科的一场革命

4月17日下午,武汉大学教授、数字人文研究中心主任王晓光在华东师大闵行校区图书馆做了“全球视野下的数字人文:研究与实践”的演讲,从数字人文的时代兴起的背景谈起,解释相关概念、研究对象、研究方法和工具、发展趋势等,最后谈到了在大数据时代关于人文社科研究路径创新的问题。该演讲系华东师范大学第五届思勉人文思想节的系列名家演讲活动中的一场,由华东师范大学中文系教授、图书馆馆长胡晓明主持。以下系演讲现场实录稿节选。(澎湃新闻实习记者 潘体芳)

虽然斯坦福推出的联合专业并非新生事物,但它的创新之处在于,首次将人文、理工这两个常被认为是“水火不相容”的专业融合在了一起。当然,像这样的联合专业是否会得到学生青睐,似乎还有待时间考证,但至少斯坦福的教师对此充满期待。文理交融的新专业3月初,斯坦福大学宣布,经由该校“教师议会”投票通过,即将在2014年秋季先行推出一种将人文学科与计算机科学合二为一的本科“联合专业”。作为一种实验,首批推出的两个专业,一是计算机科学与英语,一是计算机科学与音乐。在美国,高校的专业一般分为(主修)专业和辅修专业,除此之外,还有双专业或者说是双学位。前者不难理解,而双专业或双学位则是要完成两个独立学科的所有专业要求。一般来说,双专业或双学位需要多读一年书,从而完成两个学科的学习要求。在美国,获得双学位的现象越来越普遍。虽然学生所选的是两个专业,但大多数学校只发一个学位,不过上面会列明两个专业的名称。据统计,大约1/4的学生获得双学位,甚至有些高校比例更高,达到40%。这一数字升高的原因大致有两个:一是学生在高中时就学习了一些大学课程,到大学后有时间和精力再学另外一门专业;二是为了未来就业的便利。斯坦福所推出的并非双专业或双学位,而是近年来美国高校开始流行的一种新型的专业,被称为联合专业。这种新专业一般指跨学科的专业,或者说其学位中包含了多个学科的知识。比如,一位学生可能既对会计学与计算机信息系统感兴趣,同时也有能力和意愿去学习这两个专业。那么,高校就有可能推出一个联合专业,将会计学与信息系统的核心课程合二为一,做出一个切实可行的课程以及培养方案。如此一来,学生在未来职业发展与寻找工作时就多了一份机遇。一般来说,联合专业大都是在同一大学科之下的不同专业间的融合,比如工程学科内部不同专业的融合,或者是相邻学科中的融合或者合二为一,如金融学与经济学、生物学与工程学等。当然,各个高校对此的规定也不尽相同。虽然斯坦福推出的联合专业并非新生事物,但它的创新之处在于,首次将人文、理工这两个常被认为是“水火不相容”的专业融合在了一起。“文理”如何“交融”斯坦福此次的联合专业试图打破传统的文理界限,努力将两者的学科精髓融为一体。之所以选择计算机科学,应该是基于这门学科在诸多领域中扮演着越来越重要角色的缘故。以英语专业为例,计算科学技术在分析文学作品中日益显示其重要性,特别是数据库的使用使文学研究、语言学研究都不再是感性认识和理性推断的结果。在音乐学科中,使用电脑进行音乐创作和音乐制作,如软件设计、人机交互、超声处理等,都已经变得越来越普遍。其实,整个人文学科又何尝不是如此?正如斯坦福大学英语系副教授詹金斯(Nicholas Jenkins)所说,人文学科与计算机科学这两者在日益相互靠拢。而当下的人文学科研究中,计算方法已经变得越来越重要;与此同时,对人文学科来说十分重要的诸如美学的、认知的、伦理的与交际的问题,对计算机信息处理技术的未来而言,也同样变得越来越重要。因此,这个专业将鼓励学生跨越两个不同学科的分界线。当然,完成这样一个学位并非易事。首先,来自两个专业的导师们要为学生设计一套全新的课程体系。这套课程融合了两个专业的知识体系,并且强调这两个专业的结合点。到了大四,学生需要参与并完成一个“顶点”项目,或者完成一篇跨学科的荣誉学位论文。而这两项工作都需要将两个专业的方方面面结合起来,使人看到学生对两者综合性知识的深入了解和理解。达到了上述要求,到学生毕业时,就可以获得一个独立的、全新的学位——文理学士学位。当然,像这样的联合专业是否会得到学生青睐,似乎还有待时间考证,但至少斯坦福的教师对此充满期待。英语系系主任琼斯(Gavin Jones)表示,类似的整合性工作已经在斯坦福开展起来了,去年英语系最佳本科生荣誉毕业论文获得者就是用计算分析的方法,讨论了一部小说中“loudness(音量)”一词的使用。与此同时,很多英语系的本科生都自觉地进行跨学科思考。而联合专业的推出,将会进一步鼓励学生从事这方面的研究工作。音乐系的一位副教授也表示,“如果我在读书的时候有这样的专业,那我一定会选择进入这样的专业”,因为音乐与技术总是并肩前进,而音乐与计算科学的“融合”,无疑是抓住了两者的灵魂。培养新一代的“两栖人才”实际上,这一融合文理专业的做法,在美国已经起步。比如,在美国,很多高校建设有数字化人文学科的项目,师生不仅可以学习基于计算机的文本、3D的谱系、数字化、视觉化等多种研究技巧,甚至可以创立新型的人文学科研究体系。但斯坦福大学联合专业的推出,无疑是一种“跨学科的”新型培养模式,其目的是要为学生应对当今世界知识越来越具有跨学科特征的挑战提供服务。斯坦福此次改革并非偶然。在今年2月份,教师议会就通过了一个决议,鼓励所有院系开展联合专业的创设工作。从目前来看,斯坦福之所以推出新型的专业,大体上有三个原因:第一,学生与社会对此有需求。一些学生想在学术追求与未来职业的实际考虑上追求一个平衡点。正如詹金斯所说,知识界在改变,职场也在改变。斯坦福希望培养的是新一代的“两栖人才”——会编码解码的人文学者;由于浸染了人文学科,创造性与适应能力得以加强的计算机工程师。这些人可以被称作新时代的人文学者与新型的工程师。第二,源自斯坦福不断追求变革的新思想。联合专业的核心思想是追求“综合学习”,而这一概念是2012年斯坦福本科教育改革中的重要思想。现如今,文理交融专业的出现,正是本科教育改革的一个体现。第三,无论是在科学技术学科,还是在人文学科,抑或是社会科学,斯坦福都有着国际一流的实力与师资队伍,可以保证创设出这样的联合专业,以备学生之需,也为社会提供所需要的两栖人才。斯坦福称,有关这两个专业的详情,学校随后还会予以公布。而在未来,斯坦福也会批准和推出更多的联合专业。对此,我们可以拭目以待。 (2014-03-27)

图片 1

图片 2

“数字化人文学科”就是数字媒介与传统人文学科研究在各自发展的道路上碰到了一起,进而走向了一种交叉与融合。

武汉大学教授、数字人文研究中心主任王晓光在华东师大闵行校区图书馆做了“全球视野下的数字人文:研究与实践”的演讲

技术改变教育,技术也改变学术。由于“数字化人文学科”的出现,技术带给人文学科的,可谓一场革命。

今天我想讲这样一些内容,大概有9个方面的内容,时间会在一个半小时或者多一点时间。首先,讲一下数字人文的时代兴起背景,数字人文源还是化主要概念,数字人文概念,研究什么?数字人文国际上相关的组织机构,常用的数字人文方法和工具,国家数字人文研究的整体和概况发展趋势是什么?以及武汉大学数字人文研究的工作,最后简单谈一下在大数据时代,关于人文社科研究路径创新的一些问题,因为今天是大数据的时代,谈任何的人文社科创新,不能离开时代的最基本的脉络和最基本的色彩,最后我会作总结。

所谓“数字化人文学科”(Digital Humanities,简称DH),虽然起步较晚,但已经有了超过20种的定义,目前学界较为流行的认识,是指计算机信息技术处理与人文学科间的一种交叉研究与教学领域。其主要是将数字化了的材料和本身就是数字化的材料结合起来,把传统的人文学科、社会科学的研究方法与计算机信息处理技术的工具以及数字出版融为一体。

数字人文兴起的时代背景

简言之,“数字化人文学科”就是数字媒介与传统人文学科研究在各自发展的道路上碰到了一起,进而走向了一种交叉与融合。但这种交叉与融合并非单向,而是双向的。一方面,数字化媒介的工具与技术进入到了传统的人文学科之中,另一方面,人文学科所具有的提出问题的模式也同样进入到了数字化媒介之中。

自然科学和社会科学主要是揭示研究对象的基本性质和规律,研究的目的是为了获得对象的普遍知识。但是人文学科更关心人的生存及其意义,更关心的是人的价值存在和价值实现。柏拉图说我们要建设理想和美好的社会,但是理想和美好的社会是什么样的?并不是规律,是我们探索的过程,而且不同的学者的认知、目标是有差别的。

相当一部分的数字化人文学科集中于文献与文本的研究,而它们的研究与媒介研究、信息研究、社会学研究等对于文献与文本运用数字化研究的方法有所不同。有的数字化人文学科,则是产生了新的学术分支,比如将多媒体、元数据与动态环境交融在一起。还有的数字化人文学科研究则在关注文化数据组的视觉化问题,如有研究者把计算方式运用于分析诸如谷歌图书数据库这类庞大的文化数据组。

2005年美国总统信息技术咨询委员会发布的报告中,提出计算机科学虽然本身就是一门学科,但是这门学科可以促进其他学科的发展,而且21世纪在经济上最有前途的研究前沿,都有可能通过熟练掌握的先进计算机技术并且运用技术得到解决,计算思维、计算技术的发展可以整体上推动美国所有学科的发展,保证它全方位的竞争力。不仅仅是在信息产业上的竞争力,计算有赋能的作用,可以赋予其他学科更大的能力。

虽然有人把数字化人文学科的历史追溯到了上世纪40年代,但“数字化人文学科”这一术语的诞生,则是到了2004年。当时《数字化人文学科手册》出版,该书的编者为了避免人们仅只把该研究领域视为是人文学科的数字化,而发明了这个术语。

我们现在关心的是怎样利用计算思维来和其他思维一起推动思维的进步,以及解决问题方式的进步。今天的计算机技术是上个世纪40年代开始发展的,60年代有了数据库,80年代有了互联网,90年代有了物联网,21世纪有了大数据,人工智能发展了,技术在不断进步,在进步的同时我们的理念在创新,技术不仅仅作为富有的赋能,还带来了人的思维改变。此外还有知识共享和开源。今天软件开发开源的思想是非常重要的,像谷歌公司把最重要的算法开源了,推动了算法不断迭代更新。还有大众的协同,比如维基百科,知识生产让每个人都能参与进来,而不仅仅是专家。还有人机协同,今天人工智能发展,未来人将会跟机器协同处理各种工作。

到了2006年,美国的国家人文学科基金会成立了相应机构,2008年更名为“数字化人文学科办公室”,有力推动了这一术语在美国的流行。2009年,美国现代语言协会在费城召开年会,“数字化人文学科”成为大会的主流话语,也在大会上被公认为是今后一个时期内位居首位的学科增长点。

技术的进步同时,人的思维理念也在进步。在自然科学领域,计算机彻底改变了自然科学研究的面貌。自然科学领域里对于计算机的技术已经有相当深刻的运用,比如美国高校的化学研究,现在第一步就是做计算,用高性能计算机做模拟分析,筛选出几百个或者几十个分子式,再做传统的化学实验,而不是先做实验再计算。

现在,西方国家的很多高校,都已经在体制内设置了相应的研究机构,有以“系部”命名的,也有以“学院”命名的,还有以“研究中心”命名的。这里仅举几例。比如,英国的伦敦大学国王学院专门有“数字化人文学科系”,美国弗吉尼亚大学设有“高新技术人文学科研究院”,美国克利夫兰州立大学设有“公众历史与数字化人文学科研究中心”。

在社会科学领域,研究怎么样利用计算机建模模拟和分析各种各样社会现象?怎么样利用计算机数据分析来做?用计算机和大数据来做,计算机相关技术已经在改变社科研究的基本过程。到了互联网时代,大量依靠大数据来做研究,比如传播研究领域用社交媒体来做,用社交媒体推特上的数据,而不是抽样的小样样本做社会关系方面的研究。

下面,我们不妨以建立较早的伦敦大学国王学院的“数字化人文学科系”为例,来看看这些机构的学术目标与建设任务。

人文学科虽然关注的是个体、群体以及社会整体的精神或意义世界,但是这不意味着人文学术和知识生产活动不会受到技术的影响。有些学者尤其是资深老牌学者,可能对技术有一定抵触,但是我们发现人文学术研究不可能离开技术的影响,因为人文学科生产的知识成果,直接表现为各种形式化的符号,如文字、图像、声音、视频。

DDH建立于1991年,开始时名为“计算机处理人文学科研究中心”,到2011年始更为现名。它既是一个学术的系部机构,也是一个研究中心,在国王学院隶属于艺术与人文学院。该系在全球范围内具有相当高的知名度,其基本的学术目标是要培养人们对计算机信息处理技术在人文学科研究上的应用意识,对此有所认识、理解,并且能够掌握基本的技能。

信息技术改变了目前的信息环境,信息化环境带来了互联网、带来了大数据,人文知识的表现样式也被改变了。信息技术已经在改变人文学术具体研究对象,研究对象很多时候就是符号,以及符号上承载的思想,进而通过改变、通过影响符号而影响整个人文学术的流程,所以人文学科的数字化转型,是社会数字化转型的重要的组成部分。但是在转型之中,我们必须要明白到底人文学科里面什么东西没有改变?人文学科的终极目标会否改变?会不会因为数字化影响发生改变?对于这个问题我们必须保持高度的警戒。

DDH基本的建设目标包括以下三个方面,首先,作为一个系部机构,承担着学术与专业建设的任务;其次,作为一个研究中心,倡导在人文学科研究中合理运用计算机信息处理技术;同时,作为学院众多系部之一,也为其他系部提供相应的艺术与人文学科方面的研究支持。

什么是数字人文

这些新兴机构的诞生,使得数字化人文学科有了体制的依靠,也因此获得了更多的发展途径。

数字人文在最早的时候称之为人文计算,追溯到1949年意大利神父罗伯托布萨在IBM公司帮助下对神学家托马斯的研究工作。当年对于托马斯的作品使用的还是传统的计算机,拿的是传统的卡片,有500份,成本相当昂贵。到了1954年,出现了磁带,开始做迁移,转移到了磁带上,数据量达到了1500多万的数字量。

斯坦福大学的相关研究

我们发现,人文计算的起点就是文献资料的电子化。电子技术把印刷的东西开始进行电子化,不仅改变了人们获取资料的方式,也改变了使用的方式。

斯坦福大学是美国较早开展数字化人文学科研究的高校。据该校相关资料介绍,斯坦福对数字化人文学科的研究早在上世纪80年代后期就开始了,到目前为止,虽然该校尚未有单独的机构设置,但有关方面的研究却在该校很多单位中一直开展着。这其中就包括“斯坦福人文研究中心”。

计算机科学家说,使用的工具影响了思维方式和思维习惯,也将深刻影响我们的思维能力。在我们使用印刷术的时候和使用电子技术的时候,看起来好象是资料的一种改变,实际上在改变我们的思维,在改变我们的思维能力,这种认识就逐渐地推动了人文计算思维的发展。怎么样利用计算机技术来解决和发现人文问题,并解决人文问题新的思维模式,导致人文计算的产生。人文计算理念首先在于语言学,在此之后逐渐向其他领域扩展,向历史、艺术、音乐、宗教其他人文学科开始扩散。不仅仅是技术的扩散,实际上是思维模式的扩散。从人文计算到数字人文,这个词汇有变化的过程,西方在1980年代的时候一直用的是人文计算,从2004年开始,我们改变了话语。话语的改变有时候蕴含着一种思想的改变,计算这个词听起来对于人文学科来说有点刺耳,一直强调的是思想怎么计算有点刺耳。

在该研究中心,单独设有“数字化人文学科”的专项研究。而且,据斯坦福最近的报道,该校在这方面的研究开展得如火如荼。

数字人文研究什么?

斯坦福当下的数字化人文学科项目都与跨学科研究有关,由于采用了3D绘图、电子文本分析、数字化,以及高级视觉化的技术等手段,使得这些项目都能对传统的人文研究带来新的方法、给予新的启发。然后,借助于网上发布与虚拟档案的建立,从事数字化人文学科研究的学者既尝试着共享一些能够有新发现的原始资料,同时,也在努力搭建一个学术共同体和信息共享的平台。

数字人文研究什么?数字人文是计算或者数字技术和人文学科的交叉点,包括的是系统化使用数字资源。在人文研究领域里面使用数字资源,一方面包括数据,另一方面包括各种各样数字化工具,以及对这个过程的反思性的行为。数字人文宣言中也进行了尝试性的定义:用一种新的从事学术的方式(强调的是协作、跨学科、计算化的切入)在教学、出版和研究过程中使用计算技术(强调了这样的特征,把数字技术和数字方法、数字工具用到了人文研究里面)。

就在前不久的2015年5月5日,斯坦福人文研究中心举办了一场学术研讨会,参加者都是专业领域的学者和技术方面的专家。会议的主题是讨论数字化工具如何能够突破人文学科研究固有的边界,如何能够从课堂的讲台走向文本的分析。同时,他们也探讨了人文学科独特的提出质疑的学术特征,又能如何突破数字化工具的疆域。

在这个领域里面,印刷不再是唯一的重要的媒介,数字工具、各种技术和数字媒介正在改变知识的生产和传播,媒介技术的改变对人类知识生产和传播、教学方面的改变是底层的,改变了知识的状态,这是非常颠覆性的改变。

斯坦福学者的研究获得了来自美国人文社科基金会的大力支持。这些基金项目都是专门针对人文学科研究所设计的一系列网络视觉化工具。

今天,人类刚刚进入数字社会,我们在这样的初始阶段所认识到的数字技术对于社会的影响,仍然是不全面的,是非常粗浅的。

比如,斯坦福法语副教授埃德尔斯坦和历史教授冯德伦两位领衔主持的项目“历史之网”,就获得了将近30万美元的资助。为此,该课题组要建立一套视觉化工具,从而为他们名为“绘图名人共和国”的项目服务,而这一项目就是想以名人为例,探讨在17世纪到18世纪时人与人之间是如何通过信件和物品进行交流的。而实现这一目标的工具,就是用数字化技术来分析。如此一来,该项目将会使人对欧洲文艺复兴时期联结知识分子的社交网络带来新的认识。

数字人文的研究主题、方法和工具

数字化人文学科的未来

到底数字人文领域里面研究什么主题?传统的人文研究从来不会想到建模,说到建模是数学工作,或者是计算机领域的事,但是数字人文的研究非常强调建模,我们今天使用主题模型去做大的文本集合关键主题的提取,我们需要新工具方法帮助我们研究实现新的需求。

数字化人文学科无疑还处于开端阶段,但未来却有着更加广阔的发展前景。从当下来看,“数字化人文学科”超越传统人文学科研究体现在以下三个方面:

我把数字人文分成了三个方面。

首先,数字化技术手段能够促使人文学科的学者走在人文学科的前沿,而利用新的技术手段,有利于新的学术发现。

第一,数字层面。怎么样利用新的信息化技术,创新方法和研究路径?比如说建设预料库挖掘,进行专题数据库进行挖掘统计分析,比如说通过文本挖掘技术,还有图像自动识别技术,去分析潜在的隐层的模式出来,让计算机辅助我们理解,以前这种情况主要靠人,但是大的模式人是解读不出来,所以需要计算机帮助我们来做,所以工具在任何时代、任何学科都是非常重要的解剖的工具。

其次,因为新的技术手段,往往能够把不同学科和跨学科领域的学者吸引到大家共同关心的话题与同一个学术问题当中来,从而使得不同领域的学者开展合作研究,拓展了人文学科较为单一的特征。

第二,工具层面。我们需要开发新的工具或者软件平台,比如数字出版工具。

最后,人文学科研究质疑和提出问题的学科特征,在其使用过程中,反过来有助于数字化技术手段以及计算机信息技术处理方法的改进和提高,从而将传统人文学科的主观能动性发扬光大。

第三,数字人文研究不仅仅是强调资源上的改变、工具和方法的改变,更加强调的是面向未来真正新的问题。问题可能由技术带来的,比如互联网虚拟现实、大数据、人工智能带来新的问题。也可能是技术对于资本主义的影响,比如说对我们国家经济影响,电子商务、数据的遗忘权等。人类正在向数字社会迁移,在数字社会里面我们遇到新的传统的社会不会遇到的问题。

总之,“数字化人文学科”的发展有利于人们利用现代技术手段,帮助我们更好地理解世界文化、历史与社会。对其未来前景,我们还可以拭目以待。(作者系中央民族大学外国语学院院长)

数字人文的研究流程,在方法上能分成:获取数据、创作、分享数据、分析数据、解释数据、分发数据和活动,这些活动都是数字分析方法的应用,涉及工具很多,比如在出版方面、图像的处理上面管理与分析方面,文本编码分析。

《中国科学报》 (2015-08-06 第7版 视角)

中国当代数字人文发展的重点

具体来看目前中国当代数字人文发展的重点是什么?目前来说重点对几大数据库,对它的研究项目做了统计,对国家社科教育部基金用数字数据库做了统计,我们发现相关的项目非常多,而且增长速度开始在加速增长,从2009年开始加速,在早期的时候量不是很大,但是从09年开始加速增长,如果看这个不是很清楚,我们再看看社科重大和重点基金代表了我们国家顶层,或者学者们的集中判断,他们的基本认识,重大和重点基金里面,在09年以前基本没有关于数字人文的项目,但是09年以后一下子变成了9个,2016年变成了18个翻倍了,到了2017年又再次翻倍达到37个,目前社科重大基金里面仅仅十分之一都是做数据库建设的,我们来看这些项目,拓本数据库、体育非物质文化数据库、方言数据库、俗语数据库、唐宋编辑地图、藏语语料库等等,抗战数据库,这些数据库项目是最重要的,目前我们还停留在数字资源建设的层面上,看词频越大代表词频越高,数据库语料数据库建设,目前数据库建设是数字人文研究里面基础设施建设的基础部分,是少不了。

我们起步并不算晚,最早的时候仅仅是项目检索结果可以追溯到1991年,那个时候武汉大学情报学院前身,现在是管理学院,那个时候老的系管主任,还有在91年清华大学也做了数据库建设,后来系主任焦老师也做了数据库的工作,都是比较早的。现在2017年社科重大的十分之一都和这个相关的,2018年我没有做统计,但是基本接近40多个都是做数据库建设的,社科重大基金里面,现在更加宽了,比如说铜鼓数字记录、少数民族民族数据库记录、手工艺要素数据库、户籍制度数据库、档案数据库、古籍档案、民间信仰数据库,族谱数据库等等,通过这些看到今天资料数据库整理是工作很重要的一部分。

还有数据平台建设,比如北京大学开放数据平台,复旦大学人文领域平台,一方面学者自己做数据库,高校做数据平台,支撑数据库建设很重要。我们介绍一下数据研究中心的工作,我们主要做智慧数据,主要是人文社科数据资料数字化处理方法,还有人文社科相关的数据分析软件,我们做软件开放出来给学者们使用。我们做成果,数据可视化、语音分析、文本挖掘等等开发成果,这是主题演化可视化分析语义增强、语义检索记录等等。这是我们做的诗歌制图,我们把以前的诗歌只是传统的样式,但是变成知识图谱,我们对文化图谱进行了标注,对敦煌相关文献做了知识图谱构造,这是以前不存在的工作。这是我们对莫高窟做了标注,用了多种方法。

为什么谈智慧数据?是战略问题,人文社科今天的研究,正在计算思维下有新的变化,比如有开放思维、计算量化思维、协同思维、跨学科思维和关联度思维,这是人文数字化以后带来新的思维变化,除了需要大数据支撑,还需要关联数据,需要开放资源,同时我们希望有Smart、data,有一些特征,比如说长达2000年全球协作、数据驱动、融合性的分析和视觉化的分析,这是数字人文基本特征,需要新的思维和新的数据作为支撑,这个时候我们这个学科干这个事,就是提供新的数据做支撑的,我们做什么?因为我们认识到基本的认识,就是数据科学正在成为所有的现代科学基础性的学科,尤其是在人文领域里面,随着传统文献资源数字化,一切文献都可能会成为一种可计算数据,数据科学不仅仅是自然科学,还在支撑人文社科,以前我们的人文社科主要靠脑袋想,以后可能还会有数据的处理问题,这个时候都依赖于数据科学的发展,而我们数据科学基础理论一个研究方向,而且数据处理和文献阅读对于人文学者来说是非常重要的,相对自然科学来说,人文学者更依赖于阅读和使用电子文献,因为花更多时间使用,但是工作当中发现有时候要的不是海量数据,要的是更高等级的智慧层面的数据,称之为Smart、data,更关心的是让数字资源组织水平更高,不再把传统的文献一册放在数字化,而是把文献内部的知识之间建立跨域的链接,就像刚才威尼斯里面提到的做跨域链接,知识应该超越图书,通过某种超媒介在图书之间相互关联,而这个工作如果关联起来,高级的知识组织状态就是Smart data。

智慧数据怎么样支撑人文研究?以前有原始数据,比如网页、小说、政策文本、行为数据、三维模型、古籍,我们通过语义化、数字化、关联化和形式化变成新的智慧数据的结构,用智慧数据的结构支撑在各种系统支撑下,交付系统、对话系统、软件终端发现语义支持系统,版本比对,有些问题得到解决,这些问题为人,同时分析需要机器参与,这是未来的目标,是比较宏大的目标。怎么建设智慧数据?我们人类编码能力一直在进步,从早些时候载体是拟办、族谱、文字,逐渐到网络,再到新的技术,这是图谱或者是关联数据,人类对于知识的编码能力一直在进步、一直在超越,所以智慧数据代表的是人类对知识、编码和表现的一种能力,一种进步,所以智慧数据可能代表了三个阶段,首先数字化,我们把传统的古籍图像扫描成图片,这就是数字化,得到了数字化的照片。

随后我们数据化,把知识结构化处理,进行细致地布置,我们得到了半结构的或者结构化的表格,CBBD数据库是表格化,是完全结构性的数据,这样可以做大规模统计分析,最终的目标我们希望是智慧化,可以看到这是钢铁侠,他和机器人战甲进行对话,同时是实体,但是同时也是数据体,就是平行世界里面的数字卵生,是非常新颖的概念,我们正在利用这个概念做文化管理方面的探索性的工作,一个实体本身应该是数据体,数据体能够反映实体的东西。对于图书、图书馆文献怎么在数字空间里面呈现和实体空间里面呈现,有什么样的对应关系?这就是我们要探索的目标。更多的智慧数据具体表现不再作更多解释,比如说数据本身必须解释,数据可以自描述机制,数据可以解释一切,这就是DNA,干细胞里面DNA有能力,智慧数据可溯源,数据必须是可信的。

为什么在今天历史研究里面数据不可信?因为证据没有证据,证据本身不可信,因为不可溯源,凭空产生,如果数据本身溯源,一切历史研究完全可以回到当下。智慧数据还有一些从高级状态到低级状态是兼容性的,想看原始数据、看古籍可以看,想看地图、GIS空间也可以看,智慧数据现在可以看到的几个雏形,可以看到未来的微光看到未来。第一个就是纳米出版物或者微型出版物,新的论文模型,大多数不会接触到。第二个是关联数据,这个慢慢很多图书馆会使用到它,比如说里面有很多博物馆、图书馆,把它们的数据关联化发布了,这样可以保证做探索,去发现自己,自己不知道,不知道自己不知道发现这种东西。

还有知识图谱,可以实现知识之间的推理,这样可以辅助找到不太明确的线索,这是我们让计算机怎么样辅助我们做研究的时候,更多体现在发现线索上面。这是我个人的工作,就是跨模态关联,中国在历史领域当中总是讲一个概念,就是左图右史,左边发现地图,右边看史书,看史书的时候看位置,这样古代学者研究理解地图是非常重要的,但是图像和文本在多的情况下被分离了,被分割的,在我们很多时候尤其博物馆看到实物和图不知道背后的知识,怎么样把壁画和壁画背后知识关联起来?需要做探索,我们希望用敦煌构造智慧数据的原型,智慧数据做探索,我们做了本体、数据模型,我们做了敦煌洞窟的本体,我们把几个综合起来做的工作。我们用本体、用知识图谱构建图像适度标注,标注完了之后再做展示,这样可以把图像内部的热点和知识点和背后知识关联起来,过程是一个数据驱动的模式,是一种数据驱动的。

大数据时代人文社科路径创新

人文社科一般遵循流程,发现问题、使用方法、寻找数据和文献、分析问题、发表成果,这是人文社科基本工作的学术流程和环节,看大数据对这些东西产生了什么影响,或者数字化技术和大数据对每个环节产生了什么影响?我们现在有一些说法,第一个就是新问题,大数据给我们带来了新的场景,新的场景产生新的问题,但是在新的场景下希望解决老问题,所以在问题层面上最重要的,我们需要创造一些新的环境解决老的问题,同时我们还要发现一些新的问题,在新的数据时代的场景下要解决新的问题。

在方法层面,我们需要有新的方法,比如说数据驱动,数据驱动的方法跟传统的人文社科研究、理论驱动方法要相结合,不能说谁替代谁,是应该相结合的。还有互联网观察法,互联网正在成为观察社会的基本视角,以前我们做田野调查,到村里面到市面上去,现在通过互联网本身可以做田野调查,比如说通过快手可以看大货车司机他们的生活状态,还有众包科学,以前很多研究方法上面采用的是专家,大多数学者研究是专家实现的,但是今天通过众包可以让大众参与到知识生产过程中,还有虚拟实验室方法,以前我们知道对一个问题的研究,很多时候是没有办法通过虚拟仿真实验的,但是我们通过VI在虚拟空间里面,比如第二人生游戏,可以推演一个事件,或者一个活动,这样给我们观察社会,或者研究某些活动给了你新的虚拟空间,这些是方法上的创新。

在数据和文献上面,今天我们通过文献数字化,可以把传统的文献变成了新的数字文献,但是更重要的是使用新数据,比如说互联网数据,互联网目前是非常庞大的数据载体,记载了人类社会的各个方面,所以我们很多数据都可以通过互联网数据获取,可以代替传统文献。其次,在物联网是更大问题,今天智慧地球、智慧城市的发展,可以给我们很多的物联网数据,这种数据对人文社科都非常有帮助的。比如说公共汽车,公共汽车的通行,什么人使用公共汽车?这些年有什么变化?如果有公共汽车的数据,马上公交的数据不仅仅是路线优化和数学问题,还反映了民生问题。还有移动手机,今天手机记录了所有的信息,人文问题、自然科学问题统统可以通过手机反映出来。

分析部分除了定性和定量相结合,空间分析和时间分析、演绎和归纳分析、整体和部分、人工+机器都要结合起来进行分析,再发表,科研成果不仅仅是做成印刷文献专著,还通过网站和手机,或者通过软件的方式当作科研成果,越来越多科研成果就是软件本身。今天大数据同时是一种数据支撑推动我们的研究,而本身数据也是一种社会时代,会改变社会生态,所以两种视角相结合,可能让我们把人文社科的研究会更加准确,但是需要注意的基本问题,比如数据只是简约事实,不代表全部,所以更代表信念,个人隐私不可以触碰,我们在快手研究的时候个人隐私不能泄漏,数据作为新时代必须遵循新时代的伦理,信息素养制约了人文学者对数据资源的利用,因为不知道数据怎么处理。人文信息思维可能是抽象和思辨能力,人作为研究者本身存在的基本意义。我们武汉大学资深教授马老师,在数据方法训练上作最后总结时候,作了非常精彩报告,如果把大数据分析利用自然方法研究自然社科,在同时千万不能忽略人文社会研究中的价值,还有主体参与的问题,尤其对于价值的观念,在任何时候不能被忽略了。

总结

数字人文作为一个印刷环境向数字环境变迁中的路标性意义的概念,不光人文学者从低档复杂的资料当中收集起来,还要从高层次发现,从而加快研究速度提升研究效率,人文研究数字人文推纳传统人文学者接纳新的理念、新的思维、新的方法、路径、工具、数据,推动人文研究在问题本身和手段的持续性的拓展和创新,数字人文基于传统的人文并不替代传统人文,而是传统人文学科在数字时代的自然延伸和发展,是借助于数字技术改变人文知识的生产获取,标注取向、比较阐释表现样式,是数字化式的一种学术活动,所以宏大意义上来说,数字人文致力于新的方式提出人文问题,定义人文问题和研究人文问题,而且数字人文为我们的数字原著文,为下一代提供了新的数字认知路径,数字人文对数字化革命单向、不可逆转的回应,数字人文成为未来数字活动里面人文框架里面本题型框架和基础性范式。

图片 3

4月17日下午,武汉大学教授、数字人文研究中心主任王晓光在华东师大闵行校区图书馆做了“全球视野下的数字人文:研究与实践”的演讲,从数字人文的时代兴起的背景谈起,解释相关概念、研究对象、研究方法和工具、发展趋势等,最后谈到了在大数据时代关于人文社科研究路径创新的问题。该演讲系华东师范大学第五届思勉人文思想节的系列名家演讲活动中的一场,由华东师范大学中文系教授、图书馆馆长胡晓明主持。

本文由必赢平台官方网址发布,转载请注明来源

关键词: