原标题:人文研究数字化:一场方兴未艾的变革

光明日报记者 计亚男 杜羽

清华大学人文学院院长万俊人30多年前在北京大学读书时,曾问过北大历史系教授田余庆一个问题:“田先生,‘二十四史’您看了几遍?”

“傻小子,没有一个史学家能够读完‘二十四史’的。”田余庆的回答,给万俊人留下了深刻印象。

如今,有了古籍数据库,输入关键词,瞬间,“二十四史”中的相关内容就涌现在眼前了,检索和阅读的便捷性有了极大提升。读完“二十四史”虽然仍然需要下苦功夫,但利用“二十四史”已经越来越方便。

从纸本阅读到检索系统,从检索系统到分析系统,人文学术的研究工具正在向“数字化”的方向转变,和万俊人一样,很多人文学者的研究中越来越离不开“数字”了。

“不数字无人文的时代”到来

在信息的汪洋里,既要放宽眼界,又要盯准目标,不被淹没,是学者们共同的需求和愿望。

“现在我们处在海量的信息中,这信息量不是宏观,而是巨观的。”台湾大学资讯工程系教授、数位人文中心主任项洁如是说。

从微观到中观,从中观到宏观,再到巨观,信息视域越来越广阔无边。人文学者如何驾驭浩如烟海的文献材料?数字技术能帮他们做什么?

“对于人文学者来讲,从来不是看几篇文章就可以开始写作,而是要看大量的文献才敢下笔。”项洁分析道,“因为作者检索到的文献是一个系统,要找出这些文献之间的脉络关系,是至关重要的事情。”

“如果一位学者仅仅具备本学科的学术训练,而不具备数字思维,欠缺运用数字技术进行研究的能力,即使他的学术功底再扎实,今后也寸步难行。”商务印书馆执行董事顾青说,“目前,我们利用数字技术进行人文学术研究的人群还不够多。我坚信,在不远的将来,我们不必再用‘数字人文’这样的名号来宣示我们区别于传统研究的立场。因为,‘不数字无人文的时代’已经到来,数字人文将深刻地改变学者,尤其是人文社科学者们的知识结构和研究路径。”

事实上,在一些学者看来,人文与数字,从来就没有分过家。

万俊人从古埃及、古希腊的建筑和哲学中,指出数字人文的神妙:“埃及金字塔,至今还是一个谜。它之所以能够历经4700多年的风雨,不只有古埃及人的信仰、图腾和崇拜因素,还有数字的因素。在一片茫茫大漠的顶端,铸造了繁多规整和雄伟的建筑,而且是用巨大的石头垒起来,没有精确的数字计算,是不能够做到这一点的。”

万俊人认为,人文学术的源头就与数字有关。他说:“古希腊哲学家毕达哥拉斯,他的哲学源自数字。从他开始,希腊哲学开始产生了数学的传统。中国古代哲学也是如此,例如《易经》。所以,人文和数字从一开始就是孪生兄妹,只不过在后来的岁月里,两者走得比较远了些,看似它们已经告别了,其实它们一直在同一条路上,与人类文明和文化同行。”

用数字方法,解决人文研究难题

数字人文的发展动力,在于采用新的方法,解决过去难以解决的问题。

多年来,项洁研究团队一直致力于满足人文学者对内容数字化的需求,建立一个属于他们自己的资料库,来处理、标注和分析资料,使内容和工具能够互动起来。

顾青回忆起30多年前,他在北京大学读书的时候,上过一门“工具书使用”的课程,讲的都是怎么使用纸质工具书。今天,这门课程涉及的很多工具书已经可以被数字化工具所取代,其中的一些工具书已进入古籍收藏家的视野,实用价值远不如从前。

清华大学人文学院副教授李飞跃和中国社会科学院文学研究所助理研究员赵薇介绍,几十年来中国人文学科的定量分析成果纷纷涌现,用数字手段检验和打破了一些人们习焉不察的定见:

20世纪80年代,陈炳藻、李贤平、施健军和陈大康等海内外中国学者分别采用文体测量学的办法,利用人工统计或计算机辅助手段,对《石头记》前八十回、后四十回作者统一性问题作出判定;2005年,哈佛大学包弼德与北京大学等合建“中国历代人物传记资料库”(CBDB);2001年,复旦大学和哈佛大学共建“中国历史地理信息系统”(CHGIS)等,这些人文学者是数字人文的先行者。

“长安城图的精准化和数位化应用”,这是台湾中山大学中文系教授简锦松利用数字化技术进行的一项研究。据他介绍,过去学界对唐代长安城的了解,都是从留存下来的纸质图上看到的。现在可以对原始的古图做数字化处理,然后放进电子地图里,就能看到精准的长安古城面貌了。

这项研究既有学术价值,也很有趣。比如,有了这张数字化图,就可以知道白居易的家住在哪里,上朝要走多久;也可以知道韩愈从家里出来拜访张继,要经过什么路径;李商隐为悼念亡妻写下了著名的《西亭》:“此夜西亭月正圆,疏帘相伴宿风烟。梧桐莫更翻清露,孤鹤从来不得眠。”从李商隐家到他妻子娘家的居所西亭,路程并不遥远,只有1.7公里。

借助中南民族大学文学与新闻传播学院王兆鹏教授构建的“唐宋文学编年地图平台”和“汉魏六朝文学编年地图平台”数据库,也可以了解唐宋时期和汉魏六朝时期作家的活动情况。

“数字人文,能够在相当程度上帮助传统的研究工作,让学者们有更多时间去做计算机目前还不能做的研究。”清华大学人文学院教授、《数字人文》期刊主编刘石说。比如,古籍标点、字句校勘、索引编纂、资料汇编,过去的学者在这些方面花费了大量心血,如今都可以借助计算机去完成。

建立起知识的关联,是数字人文的本事

数字人文兴起的前提,是人文资料和文献档案的电子化与数据化。

刘石认为,当今社会,数字化的浪潮无所不在,也深刻地影响着包括人文和社会科学在内的一切领域。数字人文,推动了当代文献学的发展,使之形成数据驱动、实证为先的新特征。“前几年,人文学界有一种轻文献考辨、重义理阐发的现象,导致学风空疏的倾向。现在有了数字人文,你想空疏都空疏不了。因为,数字人文中的大数据,不就是拿数据说话的实证研究吗?所以,从这个角度讲,文献学、古籍整理,或者考据学,今后不见得会消亡,反而会随着数字人文的发展获得新的活力。”

众所周知,钱钟书先生博闻强记,而他的记忆力与他的学术成就息息相关。有人提出疑问:进入数字人文时代,学者的记忆能力还重要吗?清华大学计算机科学与技术系主任、《数字人文》期刊主编孙茂松教授认为:“实际上,电脑时代并不意味着什么都能搜索到。数字人文要做的,不是把死的知识存在那里,而是要建立起不同知识间的关联,有丰富的知识联想,让知识活起来,进行深入的学术融合。”

“我们现在遇到的一个最大的问题,就是有了大量的电子文本之后,怎样利用这些数据库进行研究?”美国巴克内尔大学东亚研究系教授陈松说。

因为,人工智能必须由人去做,才会智能,才有可能做出有价值的研究。

李飞跃从教学角度来分析数字人文:“过去我们说,知识就是力量。工业化时代标准化的教育,更重视知识技能的传授教育。如今,信息时代的教育有一个非常重要的特点,就是更重视建立知识之间的关联,这才是力量。”

正如项洁所说的那样,这些细微而生动的数字化,“从巨观上,穿越了不同知识和学科之间的隔断,才能从微观上直达知识的细节”。

“从科学革命开始,学界有一个很大的分流,就是理工以发现为主,人文则以解释为主。如今,有了数字人文这座新的桥梁,把以发现为主的理工学术带到人文学界,人文学术将会有新的发展。”香港科技大学人文与社会科学学院教授李中清说。

“数字人文是人文社科学术研究的未来,希望在信息科技领域中,有最懂传统文化的人;在人文学术界中,有最懂数字技术的人。”这是顾青的期待,也是学者们共同的期盼。 

推荐内容