Modern Linguistics
Vol. 11  No. 02 ( 2023 ), Article ID: 61838 , 12 pages
10.12677/ML.2023.112094

基于语料库的《瑞普·凡·温克尔》 多元主题解析

伍勇进

湖南师范大学外国语学院,湖南 长沙

收稿日期:2023年1月23日;录用日期:2023年2月16日;发布日期:2023年2月24日

摘要

华盛顿·欧文在美国文学史上占有重要地位,被誉为美国文学之父,但很少有学者对其作品进行定量研究。因此,本文结合AntConc,Vosviewer和ROST CM6软件,对其最为知名的短篇故事《瑞普·凡·温克尔》的主题进行基于语料库的数字人文研究。通过语料库的高频词、主题词与社会语义网络从情节和意象方面更加直观地解读该故事历史书写、自然神、反清教以及印第安失落的主题思想。这说明结合语料库方法分析文本能够辅助发现潜在线索,为文学作品的研究提供了新的可能。

关键词

语料库,数字人文,定量分析,《瑞普·凡·温克尔》,远读

A Corpus-Based Analysis on Multi-Theme of Rip Van Winkle

Yongjin Wu

Foreign Studies College, Hunan Normal University, Changsha Hunan

Received: Jan. 23rd, 2023; accepted: Feb. 16th, 2023; published: Feb. 24th, 2023

ABSTRACT

Washington Irving occupies an important position in the history of American literature and is regarded as the father of American literature. However, few scholars have made quantitative studies on his works. Therefore, this paper combines AntConc, Vosviewer and ROST CM6 software to conduct a corpus-based digital humanities study on the theme of his most famous short story Rip Van Winkle. Through the high-frequency words, keywords and social semantic network of the corpus, the theme of historical writing, deism, anti-Puritanism and Indian loss are interpreted more intuitively from the aspects of plot and image. This research shows that corpus-based analysis can help to find potential clues and provide a new possibility for the study of literary works.

Keywords:Corpus, Digital Humanities, Quantitative Analysis, Rip Van Winkle, Distant Reading

Copyright © 2023 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

长期以来,内省式研究方法在文学研究中独步天下,只是到了20世纪80年代初,语料库方法才开始应用于文学研究之中。内省式方法是指研究者依据自己的直觉和判断,就具体文学事实或文学现象提出理论假设,并选择少量典型的案例加以论证的方法。内省式方法的应用往往使得具体研究结论具有一定程度的主观性和片面性 [1] 。随着数字信息媒介的发展,人类社会逐步进入大数据时代,数字媒介和人文学科的结合与交叉,重构了传统人文研究的知识谱系与认知概念,从而引发了研究范式的革新,将人文学科引向了更为系统、更为多元、更为复杂的新研究领域,自此数字人文应运而生。董洪川指出数字人文视阈下的外国文学研究范式应以定量辅助定性研究,将社会科学的定量研究方法与人文科学的定性研究方法结合起来,对文学文本的既有信息进行检索、提炼和呈现,并从多层面、多维度生成二次信息、提出新的问题,得出新的结论 [2] 。鉴于此,本文选取华盛顿·欧文的代表作品《瑞普·凡·温克尔》为研究对象,结合数字人文的“远读”技术对该短篇故事进行文本挖掘和定量分析,最后辅以内省式的文本细读试图发掘故事的潜在主题。

2. 语料来源与数据处理

本文选取Rip Van Winkle原文及2005年万紫翻译的《欧文短篇小说选》中对应篇目的中文译文为数据来源,采用语料库检索软件AntConc3.5.8,可视化软件Vosviewer及文本内容挖掘软件ROST CM6用于文本高频词和主题词表生成,前人文献主题的可视化以及该故事的社会语义网络图谱绘制。为避免由文本中大量存在的诸如“go,went,mountain,moutains”等因屈折变换导致的同义表达及在各类文本中都高频出现的如“of,a,the,and”等虚词或助动词所带来的统计偏差,本文使用Lemma List (词元词表)和Stopword List (停用词表)进行归一化和去停用词的文本预处理。考虑到欧文的出生时间(1783年4月3日)和Rip Van Winkle的面世时间(1819年),本文共搜集了1778~1817年间创作的14部英文小说(细节目录见表1),应用正则表达式[A-Za-z0-9-] + 统计文本字数共2,203,222词(不含标点符号),作为参照语料库(reference Corpus),Rip Van Winkle原文作为观察语料库(observed corpus)。该参照语料库为观察语料库的300余倍,前者较后者足够大,主题词统计结果可以较为精确地反映出语篇层面词语的分布与文本主题的关系以及词语之间的关系。

3. 高频词分析

本文将《瑞普·凡·温克尔》原文处理成utf-8格式的txt文本后导入AntConc3.5.8中,在AntConc中分别选择Tool Preferences-Word List-Lemma List和Tool Preferences-Word List-Word List Range-Use a stoplist below-Add Words From File导入Lemma List和Stop List,最后应用AntConc的Word List功能生成原文词频表,如下表2

Table 1. Details of self-built corpus

表1. 自建语料库详情

Table 2. High-frequency wordlist generated by AntConc

表2. AntConc生成的高频词表

3.1. “Old”——怀旧与历史编织

通过高频词表可以发现“old”这一形容词在文中出现的频次竟同主人公Rip Van Winkle出现的频次大致等同,可以说“old”隐喻了作者在文本创作过程中对“过往”、“历史”以及“更迭”有意或无意的关注。利用AntConc3.5.8的情节检索(Concordance Plot)功能,可以发现“old”实际上贯穿了故事始终(见图1),尤其在故事的后半段,也就是瑞普苏醒回村部分。文中反复出现修饰词“old”,同时作者在故事结尾刻意将瑞普的晚年生活安排成“恢复了他往日的行径和习惯;不久他又找到了许多老朋友,不过这一班人都已经到了风烛残年,因此他宁愿跟晚一辈的人交朋友,不久他就得到他们的爱戴。他在家里也没有什么事情可做,而且已经到了逍遥闲散的幸福年龄,因此,他又终日坐在旅店门口,大家都尊他为村中的老前辈,把他看作一部活的“战前”旧时代的历史”( [3] , p. 726),可见瑞普醒后的生活,或者说是美国独立后的生活较之前并无二致,“old”的高频出现形成了怀旧的复调,一方面,流露出作者对过往田园隐逸生活的怀恋,而另一方面,也借瑞普之口,表达了作者对历史更迭与政治认同的逃遁与保守。

Figure 1. Concordance Plot of “old”

图1. “old”情节索引

结合Concordance检索(见图2),发现“old”在原文中大多用在荷兰先祖的幽灵之前。换句话说,文中高频词“old”形成的怀旧复调实际上是与荷兰先祖的鬼魅形象反复勾连的,“old”指涉的历史性与荷兰早期移民的历史记忆存在共线性,文中对于美利坚历史的书写是经由荷兰移民幽灵的记忆编织起来的。朱迪丝·理查森指出“幽灵作为一种文化记忆形式具有反常的吸引力,它能够从阴影中编织出历史感,并表达和消除一个建立在殖民主义掠夺基础上的主要由陌生人组成的国家所固有的社会焦虑” [4] 。美利坚生来就是民主共和国的“成年人样态”,而由于缺乏“孩童期”的成长经历,美国人身份就成为一种基于鬼神传说、历史叙事与逸闻趣谈的杂糅建构。在此建构过程中,作为先驱者的欧文采用幽灵故事赋予荷兰人以美国本土或至少是归化了的地方精神的特权,使他们成为历史记忆的核心,于是瑞普祖先的地方记忆就通过幽灵这个媒介关联起了美利坚民族身份的建构 [4] 。这或许证明,欧文相信纽约历史的根基孕育在荷兰传统之中,这种传统指引着纽约人乃至美国人为自己的身份寻根,从而构成了书写美利坚国家历史不可或缺的源泉。

Figure 2. KWIC of “old” in AntConc

图2. “old”KWIC检索

3.2. “Mountain”——自然的神性与恒常

通过高频词表可知“mountain”是全文出现频次最高的名词,是故事情节发展的重要组成部分和典型意象。通过比对“mountain”和主人公“Rip”的出现情况(分别见图3图4)可以发现两者之间存在绝对的重叠和共现,“mountain”参与了主人公瑞普从“入山遇仙”到“饮酒入眠”再到“醒后返村”最后发现“沧海桑田”的整个过程,同时值得注意的是,“mountain”在文本中出现的范围居然比作为故事主人公“Rip”出现的范围更广。比对图3图4,可以发现“mountain”就好像一个闭环将主人公“Rip”的整个情节囊括其中,而“mountain”独有两段则是故事开篇和尾注部分。换句话说,“mountain”在“Rip”的故事发生前就已出现,而在“Rip”的故事落幕后“mountain”也依然存在于文本的边缘部分——尾注中,从这一角度来看,“mountain”就像一个恒常的存在,不以人的意志为转移。对于这一现象的解释或许可以从以下两个角度进行推论和解读。

Figure 3. Concordance plot of “mountain”

图3. “mountain”情节索引

Figure 4. Concordance plot of “Rip”

图4. “Rip”情节索引

作者在故事开篇就重点描述了神奇的丛山(fairy mountains),提及群山“威凌四周的乡村”(lording it over the surrounding country),暗示群山是具有神性的,凌驾于凡尘之上,按地位尊卑,也当先谈及山林,而后再描写凡尘的人与事;故事开篇提到“四季的每一转换,气候的每一变化,乃至一天中每一小时,都能使这些山峦的奇幻的色彩和形态变换,远近的好主妇会把它们看作精确的晴雨表”(714),透露出具有神性的群山是发动“变换”的祖地。在原文中,河流发源于群山,这也使得哈德逊河流(Hudson)也具有着神性。当瑞普“不知不觉地爬上了卡兹吉尔丛山中一个极高的峰顶”往下眺望时,发现“here and there sleeping on its glassy bosom and at last losing itself in the blue highlands”。这段描述直接暗示了这片山林具有创造镜像(复制)和令人沉睡的神奇魔力。瑞普回村后,“看见一个和他自己上山时长得一模一样的人;神气也是那么懒散,身上当然也是同样的褴褛。可怜的瑞普现在完全搞糊涂了。他甚至对自己也有点怀疑了:不知道他究竟是瑞普呢,还是另外变了一个人”( [3] , p. 723)。山林发动“镜像和复制”的魔力,在瑞普进入异时空陷入沉睡后,又在现实世界选中瑞普的儿子复刻出新的“瑞普”,完成“瑞普”基因的接续和传承。瑞普进入洞穴中的圆形剧场可以看成是重回母体的子宫。如果说瑞普喝下了“死人之酒”意味着死亡(非事实性),那么他在山谷里的睡眠就是重归母体的暗示,而他的醒来则意味着重生。重生前的他因为喝了“死人之酒”而融入了荷兰祖先们存在的空间,故而不受凡常时间的控制;而重生后,瑞普需要回到他原来生活的环境,就必须重新受凡间时间的控制,也就是重回群山这一“变换”的祖地。因此他的一夜昏睡等于凡间的二十年。当瑞普下山回村时“他开始怀疑他和这周围的世界,是不是都中了魔法,这明明是他的家乡,他离开了不过一天”( [3] , p. 721)。而让瑞普打消这一疑虑,确信自己并未走错的理由却是因为他看见“那里是巍然耸立的卡兹吉尔丛山——远远流着的是银色的哈得逊河——每一重小山,每一个溪谷,都和往日完全一样——瑞普心里真搞糊涂了——”( [3] , p. 722)。群山发起并见证了诸多变换,但其自身是恒常不变的,凡尘中的人与事的变化,如瑞普的衰老,政权的更迭都不影响群山的恒常,瑞普的故事终结后,群山依旧伫立长存,这也使得继“Rip”的情节索引消失后,尾注部分再度了出现“mountain”。而另一方面“mountain”与“Rip”在开篇和尾注的分离也说明“mountain”的存在使故事形成了一个闭环,故事自“群山”始又到“群山”终。从现实层面来看,群山环绕着瑞普所在的村庄;在叙事层面,“mountain”建构的圆形闭环也将村庄中发生的所有故事都囊括其中,从而完成开篇群山“威凌四周的乡村”这一断言。

4. 主题词分析

本文在生成高频词表操作的基础上,收集了1778~1817年间创作的14部英语文学作品作为参照语料库,导入AntConc-Tool Preferences-Keyword List-Reference Corpus-Use Raw Files-Add Directory中,利用AntConc的Keyword List得出文本的主题词表,见表3,其中Keyness——主题性,可以反映主题词对原文主题建构的贡献程度。

Table 3. Keyword list generated by AntConc

表3. AntConc生成的主题词表

根据主题词表,可以得出,对《瑞普·凡·温克尔》主题建构具有较大影响的元素涉及:1、人物:Rip Van Winkle,Dame Van Winkle,Nicholas Vedder,a dog named Wolf,neighborhood,Knickerbocker,Indians;2、地点/空间:Dutch village,Kaatskill mountains,Hudson,ravine,tree;3、事件:gun,flagon/liquor/keg,cocked hat,ninepins,Congress,beard;4、基调词:old,henpecked,strange。结合这些主题词进行文本细读,可以推定《瑞普·凡·温克尔》的主题大致包括:

1、逃遁与浪漫主义——mountain(s), Kaatskill, Hudson, tree, ravine

2、民族性与政治焦虑——old, Dutch, gun, Congress, cocked hat, beard

3、神话原型与哥特色彩——flagon, keg, liquor, strange, Kaatskill, Hudson,

4、男权与女权的二元对立——Rip, Dame, henpecked

5、印第安与反清教——Indians, Nicholas Vedder

为验证以上关于《瑞普·凡·温克尔》主题推定是否适切,本文以主题:Rip Van Winkle为检索条件,应用Vosviewer对中国知网中《瑞普·凡·温克尔》相关的研究文献进行主题词聚类,生成可视化知识图谱如下图5

Figure 5. Bibliometric knowledge map of domestic research on Rip Van Winkle

图5. 《瑞普·凡·温克尔》国内研究知识图谱

该知识图谱显示中国学界最先关注到《瑞普·凡·温克尔》与国内类似作品的对比,而新近的研究则开始逐渐关注《瑞普·凡·温克尔》的早期译本、哥特式主题、历史书写与政治身份认同等主题。同时,软件根据内置算法,给出了现有研究的22类主题聚类,如下表4

Table 4. Clusters of keywords

表4. 主题聚类

以上聚类反映出目前学界对《瑞普·凡·温克尔》的研究情况,对比前文依据主题词表推定的5大主题可知两者大范围是重叠的,这说明基于主题词表的主题推定具有一定科学性和准确度,同时,值得注意的是,前文推定出的5大主题包含“印第安”,而该主题在国内现有研究的主题聚类中却并未出现,表明该主题尚未引起学界的普遍重视。有趣的是,《外国文学评论》2021年04期刚好刊登一篇名为“瑞普为何沉睡:《瑞普·凡·温克尔》中的政治焦虑”,文中就集中探讨了“印第安”这一主题,文章指出在刻画瑞普的人物形象时,欧文特别为他的个性中融入了印第安人的特质,而瑞普游离在白人主流价值观之外的情形便是此种特质的外化。在《附言》中,欧文一反常态地用略带贬义的“红人”(red man)指代印第安人,似乎是刻意地在二元对立的种族语境下暗示瑞普是“白人”与“红人”的矛盾统一体。因此,瑞普的边缘化无疑间接指向印第安人在美洲大陆被边缘化的现实境遇,瑞普的沉睡也由此衍生出印第安人的沉睡之意 [4] 。可见,通过远读(distant reading)确实可以有效辅助研究者发现文本的潜在主题。下文拟结合文本细读,对主题词表中的部分主题词展开细致分析:

4.1. “Gun”“Wolf”——时间指涉与情节完善

“枪”和“狼”成为主题词的原因在于其对时间的指涉及其对后文重要的推动作用。从“干净的、擦足了油的枪”变得“包着一层铁锈,扳机已经脱落,枪托也蛀空”,二十年时光的流逝被作者刻意凝聚在“枪”的物理和化学变化之中。我国梁朝任昉《述异记》中也曾记载一个类似《瑞普·凡·温克尔》的故事:“信安郡石室山,晋时王质伐木至,见童子数人棋而歌,质因听之。童子以一物与质,如枣核,质含之,不觉饥。俄顷,童子谓曰:‘何不去?’质起视,斧柯尽烂。既归,无复时人。”在《瑞普·凡·温克尔》中,时光流逝同样也是借助入山者手头工具的物理变化展现的。二者都不约而同选择将时间寓于空间之中,借助空间所有者的状态变化映衬出岁月的磨蚀。除了指涉时间,“枪”也在空间层面推动了故事情节发展,充当了一个重要伏笔。后文瑞普回村引起村民大规模关注的原因之一就包括他身上背着的锈迹斑斑的“枪”——“有一个自作聪明的、妄自尊大的老绅士,戴着一顶尖尖的三角帽,用肘排开众人,从人群中挤了过来,在凡·温克尔面前站住,一手叉腰,一手拄着手杖,他那锐利的眼光和尖尖的帽子好像刺进了瑞普的灵魂,他用严峻的口气质问他,为什么他在选举的时候,掮着枪,带着一群人,是不是打算在村子里造反”( [3] , p. 725)。这把“枪”的存在自然而然地引出了旅店前的争执,从而借他人之口诉出独立战争已然结束,政权完成更迭的社会现实,从而使情节达到高潮,凸显了故事“历史书写和政治焦虑”的中心主题。二十年前,伴随瑞普入睡的锃亮猎枪尚不具有任何政治意味,而二十年后,锈迹斑斑,枪托腐朽的“枪”却指向了造反的代名词,“枪”身份的更迭也正提示着瑞普政治身份的转变,“枪”直接勾连了故事中整个时间和空间,成为了一个对主题构建至关重要的意象。

同样的,“狼”之所以成为主题词也在于其对时间的指涉和对情节的推动,是严密情节发展逻辑的重要一环。在瑞普沉睡之前“连附近一带的狗见了他,也没有一条会对他吠的”( [3] , p. 716),而当其苏醒返村后,却是“瑞普喊它的名字,但是这个畜牲猜信地吠了起来,露着牙齿,走开了。这真是使人伤心的事——可怜的瑞普叹了口气:‘连我自己的狗也把我忘了。’”( [3] , p. 724)“在家里,瑞普的惟一知己就是那条名字叫‘狼’的狗”( [3] , p. 717),而最后就连“狼”也忘记了瑞普的身份,“狗”对瑞普态度的转变映衬了时间的流逝,也暗示了瑞普的身份认同危机。另一方面,“狼”对严密情节也具有重要作用。后文在瑞普见到女儿时,女儿曾提到“自从他带着他的猎枪出门,已经二十年了,一直没有听到他的消息——他的狗却独自回来了,不过他到底是用枪自杀,还是被印第安人提去了,谁也不知道”( [3] , p. 722)。作者特意安排了“狗独自回来”这一情节,这样的设计一方面是因为狗的活动性强,同时寿命有限,将其安排与瑞普沉睡二十年明显有悖逻辑,也会影响对瑞普入山遇仙和饮酒入睡情节的集中着墨;其次,瑞普杳无音讯,而体积小的“狼”却独自归家,侧面凸显了哥特色彩,也使得瑞普家人自然得出瑞普可能“用枪自杀,或是被印第安人提去”的猜测,从而不再寻找瑞普,使得整个故事的逻辑更加严谨。有趣的是,这或许也是对《瑞普·凡·温克尔》母本故事德国民间传说《牧羊人彼得·克劳斯》的仿写,在该传说中牧羊人彼得为寻找丢失的羊进入山洞,在里面睡了二十年,其间也是羊回了家,而主人公未归。

4.2. “Nicholas”——刻意安排的清教死亡

借助ROST CM6文本内容挖掘软件进行分词和无意义词语过滤,继而提取高频词语进行特征分析,

Figure 6. Semantic network map of Rip Van Winkle generated by ROST CM6

图6. ROST CM6生成的《瑞普·凡·温克尔》语义网络图

生成《瑞普·凡·温克尔》的语义网络图,最后利用MDS (Multidimensional scaling of geodesic distances)算法进行聚类,聚类结果如图6

该聚类直接反映了故事的重要情节,值得留意的是,文本聚类的结果显示“尼古拉斯”也是该故事的重要一环,且单独被安置为一个聚类,而这一角色在前人的相关研究中都没有提及,可以说“尼古拉斯”是一个被读者遗忘的重要角色。回到文本发现,尼古拉斯·维德尔既是村长,又是客店的老板。而这个客店是“一个由村中的圣贤、哲学家和其他有空闲的人组成的永久俱乐部”( [3] , p. 717),“这个秘密政治会议(junto)里的意见,完全控制在他的手里”( [3] , p. 717)。欧文在故事里特意将这个客店称为“junto”,而“junto”取自本杰明·富兰克林于1727年在费城创立的Junto Club (共读社),其原义是指为一个共同目标而集结的一群人(a group of people assembled for a common purpose),意在通过成员间的分享和讨论,提升彼此的英语水平和人文学修养。富兰克林是一位坚定的清教代表,他注重理性,讲究实效,“有用”是他处世哲学中的首要原则。在美国那个启蒙运动的时代,游手好闲被视为一种罪过,因为这是一种背弃社会责任和个人责任的行为。瑞普奉行及时行乐的生活哲学,与富兰克林“辛勤劳作,推迟享乐”的劝诫背道而驰。富兰克林创建的共读社最初的12名成员是商人和工匠,他们在周五晚上聚会,讨论道德、政治或自然哲学问题。俱乐部持续了38年。

巧合的是,共读社的12名成员中恰好就有一位核心成员就叫“Nicholas”。同时,结合文本中对永久俱乐部和俱乐部成员的描述,可以明显看出作者的反讽和消极态度。反观欧文对“Nicholas”结局的设定:“尼古拉斯·维德尔!唔,他死了十八年了!本来在教堂的墓地里,他坟上还有一块木碑,上面刻着他一生的事迹,现在那块木碑也烂掉了,什么也没留下”( [3] , p. 726)。欧文刻意安排了“Nicholas”的死亡,同时进一步加码,让其死后连“木碑也烂掉了,什么也没留下”。杨金才认为欧文对新英格兰北方佬及他们的清教传统持敌视态度。这种反清教思想在他的另一则故事《睡谷传奇》(The Legend of Sleepy Hollow)中也有同样的表现 [5] 。早在欧文的《纽约外史》一书中欧文就对清教徒做了相当细致的描绘并把他们写成了一群入侵者或歹徒。可以说故事中的“Nicholas”是当时清教的代名词,欧文对其命运的刻意安排实则暴露出反清教真实意旨,是作者精心安排的清教死亡。从这一角度来看,也就不难解释为何“Nicholas”为何对主题建构至关重要了。

4.3. Indians——失落的北美印第安

结合Concordance Plot的情节定位(见图7),可以发现“Indians”竟然也贯穿了故事首尾,同时在文本的边缘位置——尾注部分——密集出现,侧面暗示了故事主题与印第安边缘化的相关性。

Figure 7. Concordance plot of “Indians”

图7. “Indians”情节索引

反观“Indians”的第一次出现——“他(瑞普)参加他们的游戏,给他们做玩具,教他们放风筝和弹石子,并给他们讲关于鬼怪、巫婆和印第安人的长篇故事”( [5] , p. 715)。这段描写透露出瑞普对印第安种族和文化的熟识。学者金烁锋认为“瑞普和印第安人之间存在极大的相似性。似乎是刻意地在二元对立的种族语境下暗示瑞普是‘白人’与‘红人’的矛盾统一体”。在某种意义上,瑞普代表了入侵山林的白人,同时其自身也有着深刻的印第安烙印。

“瑞普一觉醒来时看到的是那头象征新型美利坚合众国的老鹰而不是原先受神仙召唤时见到的那只乌鸦” [5] ,而乌鸦刚好是北美印第安人的重要图腾。乌鸦神话在北美洲印第安部落神话中大量流传,分布范围遍布北美洲版图的各个区域,无论是美洲大陆西南地区的热带地区还是北部的寒冷地区,都有乌鸦神话的存在。这些乌鸦神话无一不传达着印第安先民对乌鸦信仰的信奉。可以说,印第安部落先民视乌鸦为无所不能的神圣的鸟。印第安部落先民对于乌鸦怀有朴素而单纯的崇拜之情,也深刻地影响到了他们的文化风俗,突出表现在他们隆重的节庆仪式中。在印第安地区至今还保留着狂热又盛大的敬奉乌鸦的太阳舞 [6] 。在《瑞普·凡·温克尔》中有两处对乌鸦的描写,第一处出现在瑞普被山中幽灵召唤之时:“他向四外一望,连个人影子也没有,只见一只乌鸦孤零零地振翼掠过山头”( [3] , p. 717)。值得注意的是,在《附言》中,作者讲述了一段印第安神话,指出卡斯基尔山是一个充满寓言的地区,这里的妖精女王可以随意让好运或厄运降临山谷。那些大神或者妖精居住在卡斯基尔山最荒凉的幽深处,捉弄在此处迷路的印第安猎人,甚至有猎手在这儿丢掉了性命,因此卡斯基尔山始终让印第安人感到虔诚的敬畏。这段看似松散的印第安神话的插入恰好暗示了乌鸦是印第安神灵现身的预兆,如《附言》所述,如果有人惹怒了卡斯基尔山中的妖精,就必定会有“灾难降临”,这无疑是对入侵印第安人领土的白人发出的警示。而瑞普苏醒后回到“通向圆剧场的那块地方”,“回答他的却是一群闲鸦的呱呱声,它们在高高的天空中,绕着一株倒挂在阳光照耀着的悬崖上的枯树盘旋。它们因为在很高的地方,觉得很安全,似乎正在向下面望着这个可怜人,嘲笑他的狼狈境况”( [3] , p. 719)。在这里,闲鸦的叫声就像印第安神灵的嘲笑声。同时乌鸦这个意象还埋藏了另一条线索——乌鸦与鹰的对立。通过文本细读可以发现,两次出场的乌鸦的实际状态都不好——第一次出场是“孤零零”,而第二处出场的乌鸦则是绕着枯枝盘旋才觉得安全。乌鸦代表着印第安种族和文化,而鹰代表着新生的美利坚合众国。文中对乌鸦的消极描写其实而暗示了印第安现实的糟糕处境。从美国历史来看,独立革命结束后,美国政府对待印第安人的政策发生了改变,印第安人由战时的潜在盟友和战争伙伴变成被征服的对象。在同一片土地上的印第安人并不是美国公民,也不受联邦政府保护。此后美国政府加快了西进运动的步伐,也进一步加剧了对印第安人的掠夺和伤害。欧文一直十分关注印第安人的境遇,对他们抱有深切的同情。在同收录于《见闻札记》的《印第安人性格的特点》一文中,欧文高度赞扬了印第安人坚忍淳朴的性格,哀叹他们被战争剥夺了土地 [4] 。也正因此在该故事中作者有意识地将“Indians”放逐在文本的边缘——尾注部分,同时刻意让具有印第安烙印的瑞普沉睡以刻意避开独立战争,让瑞普至少可以在战争中保持一种中立态度。

5. 结语

数字人文技术支撑的远读可以发掘隐藏在文本中的潜在线索,结合文本细读和文学批评则可更加深入地探究文学作品的主题建构和内在价值。高频词“old”与荷兰早期移民的幽灵形象反复勾连,形成怀旧的复调,暗示故事逃遁与历史书写的主题。另一高频词“mountain”是鬼魅的祖地,也是自然之母的子宫,其在故事中的出场将所有情节囊括其中,形成自“山”始(开篇)至“山”终(附言)的情节闭环,“moutain”的恒常与历史的沧桑形成对比,体现出故事的自然神思想。主题词“gun”和“wolf”指涉时间,透露政治的跌宕及身份认同的失真。主题词“Nicholas”是共读社的代名词,其墓碑的朽坏体现了欧文对新英格兰清教传统的敌视态度。主题词“Indians”在故事中以“乌鸦”为化身,乌鸦的消极描写暗示了印第安现实的糟糕处境,欧文刻意将“Indians”放逐在文本的边缘——附言部分,也透露出作者对印第安失落的同情。本文只是对部分主题词的尝试解读,其余的主题词如“ninepins”,笔者认为“九柱戏”在最开始本是宗教驱邪的仪式,后在18世纪演变为美国流行的娱乐游戏,故事中“九柱戏”造成的雷鸣般的隆隆声,一方面暗示了美利坚当时如火如荼的驱巫运动,另一方面也喻指了瑞普入睡后无法听到的独立战争的炮火声。限于篇幅,笔者未在正文部分予以展开,后续将进一步寻找例证,尝试对相关主题词进行解读。同时,上述的主题词表也留存了部分问题尚待解决,如主题词“cocked hat”和“beard”与故事的主题构建又有何关系,它们为何能成为主题词,同时又该如何解读?这或许需要后续研究者的结合数字人文方法进一步分析和发掘。总的来说,本文论证了结合数字人文技术辅助文本细读从而实现文本潜在主题挖掘的可行性,是文学跨学科研究的有效尝试与实践。

基金项目

本文受湖南省大学生创新创业训练计划项目(项目批准号:S202210542074)资助,使用该项目自建的大型英汉历时语料库。

文章引用

伍勇进. 基于语料库的《瑞普•凡•温克尔》多元主题解析
A Corpus-Based Analysis on Multi-Theme of Rip Van Winkle[J]. 现代语言学, 2023, 11(02): 665-676. https://doi.org/10.12677/ML.2023.112094

参考文献

  1. 1. 胡开宝, 杨枫. 基于语料库的文学研究: 内涵与意义[J]. 浙江大学学报(人文社会科学版), 2019, 49(5): 143-156.

  2. 2. 董洪川, 潘琳琳. 数字人文与外国文学研究范式转换[J]. 西南民族大学学报(人文社科版), 2018, 39(9): 174-179.

  3. 3. Irving, W. (1961) The Sketch Book of Geoffrey Crayon, Gent. New American Library Inc., New York.

  4. 4. 金烁锋. 瑞普为何沉睡: 《瑞普∙凡∙温克尔》中的政治焦虑[J]. 外国文学评论, 2021(4): 26-45.

  5. 5. 杨金才. 从《瑞普∙凡∙温克尔》看华盛顿∙欧文的历史文本意识[J]. 解放军外国语学院学报, 2001, 24(6): 75-79.

  6. 6. 郭美辰. 从乌鸦神话看北美洲与东北亚民间文化关联[D]: [硕士学位论文]. 长春: 东北师范大学, 2017.

期刊菜单