Modern Linguistics
Vol. 07  No. 01 ( 2019 ), Article ID: 28868 , 7 pages
10.12677/ML.2019.71005

COCA Corpus-Based Study of the Near-Synonymous Verbs

—Taking “Destroy”, “Damage” and “Ruin” for Reference

Shumin Zhuo

Wuhan University of Technology, Wuhan Hubei

Received: Jan. 24th, 2019; accepted: Feb. 7th, 2019; published: Feb. 14th, 2019

ABSTRACT

With the rise of corpus linguistics, natural language data in the corpus have gradually become an important tool in language teaching. Based on COCA corpus, this paper tries to discuss the differences among the three near-synonymous verbs “destroy”, “damage” and “ruin”, and makes a comparative analysis of them in word frequency, stylistics, collocation and semantic prosody. The purpose of this study is to discriminate these near-synonymous verbs and promote English learners’ interest in using corpus data.

Keywords:COCA Corpus, Near-Synonymous Verbs, Frequency, Stylistics, Collocation, Semantic Prosody

基于COCA语料库的近义动词辨析

——以Destroy,Damage和Ruin为例

卓淑敏

武汉理工大学,湖北 武汉

收稿日期:2019年1月24日;录用日期:2019年2月7日;发布日期:2019年2月14日

摘 要

随着语料库语言学的兴起,语料库中的自然语言数据逐渐成为语言教学中的重要工具。本文将基于COCA语料库,探讨“damage”,“destroy”和“ruin”这三个近义动词的异同,对其在词频、文体、搭配和语义韵这四方面进行对比分析。目的是更加准确地区分这组近义动词,同时引起英语学习者对语料库的使用兴趣。

关键词 :COCA语料库,近义动词,词频,文体,搭配,语义韵

Copyright © 2019 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

1. 引言

由于语言的任意性和创造性,近义词在英语中占有很大比例。据统计,英语中同义词、近义词的数量约占总词汇量的60% [1] 。对近义词的辨析一直是外语学习中一个难以掌握而又至关重要的环节。近义词虽然基本表达相同的概念,但是在不同的文体、上下文里、从不同角度来看还是有所差别的。在传统教学中,近义词辨析通常有如下几种方法:教材注解、词典释义和惯用搭配。这些方法较为死板且缺乏真实的语境支撑,无法解决深层的语义区分问题,学生们也难以把握近义词准确地道的用法。

语料库语言学的逐步发展为近义词辨析提供了新的思路。语料库是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续的语言文本或话语片段而建成的具有一定容量的大型电子文库 [2] ,具有容量大、语料真实、检索快捷的独特优势 [3] 。运用语料库对相关词汇进行检索、对比和分析,可以对近义词进行根本的语义区分。

国内外的学者在基于语料库的近义词辨析方面取得了较丰硕的成果。1996年,Hanks第一个使用词项整体行为研究(behavioral profile)的方法研究了“urge”,“incite”,“bother”和“abandon”这四个近义动词,他所采用的是BNC语料库(British National Corpus) [4] 。随后,Dilin Liu采用同样的方法,基于COCA语料库研究“chief”,“main”,“major”,“primary” 和“principal”所修饰的名词类型,探究各个形容词的内部语义结构 [5] 。郭放、翟红华对比研究了“affect”的类联接模式 [6] 。梅一馨探究了含有“影响”含义单词的词性转换对其语义韵的影响 [7] 。但基于语料库方法辨析近义词的研究大都限于研究各近义词的类联接、搭配选择和语义韵中的某个方面,较少同时考察近义词在上述各方面的差异。

本文采用采用现代美国英语语料库(the Corpus of Contemporary American English,简称COCA),旨在研究“destroy”,“damage”和“ruin”这三个近义动词在语义和用法上的不同。COCA语料库由杨伯翰大学的Mark Davies教授开发,是当今世界最大的美国英语平衡语料库。截止到2017年12月,COCA语料库共收集5.6亿词,涵盖1990年至2017年期间美国境内口语、小说、杂志、报纸及学术期刊五大领域的语料。基于COCA语料库,本文同时从词频、文体、搭配和语义韵这四个角度来研究“destroy”,“damage”和“ruin”这三个近义动词的不同,帮助学习者系统地区分间近义词,为语言教学中的近义词辨析提供参考。

2. 基于COCA语料库辨析近义动词“destroy”,“damage”和“ruin”

《朗文当代英语词典》(Longman Dictionary of Contemporary English)对“destroy”,“damage”和“ruin”这三个词的解释如下:

destroy: to damage sth. so badly that it no longer exists, works, etc.

damage: to cause physical harm to sth., making it less attractive, useful or valuable; to have a bad effect on sb./sth.’s life, health, happiness or chances of success.

ruin: to damage sth. so badly that it loses all its value, pleasure, etc. [8] .

根据以上释义,若仅仅学习独立的目标词,学习者可借由这些信息对这三个词进行良好掌握;然而一旦对该组近义词进行对比,区分难度便随之而来——如上信息向我们展示的词义大有重叠之处,甚至是是用一个单词来解释另一个单词。这样非常不利于英语学习者的学习。因此,基于语料库的近义词辨析还是很有必要的。下文将从词频、搭配、文体和语义韵这四个角度对这三个近义动词进行分析。

2.1. 词频

本文通过COCA语料库分别检索了“destroy”,“damage”和“ruin”这三个近义动词,选择图表分析后得到它们的总频数。由于这三个词在英语中都具有一种以上的词性,因此本文在COCA的搜索引擎中每个动词的后面加上了“.[v*]”。

Table 1. Word frequency of the three verbs

表1. 三个动词的词频

表1的数据中,我们可以看到出现频率最高的是“destroy”,出现频率最低的是“ruin”。按照表1中的数据,我们可以把这三个动词从高到低排序:destroy→damage→ruin。也就是说,“destroy”在英语中最常使用,用来表达损害或毁坏某件物体,而“ruin”使用频率最低。虽然总体频率并没有告诉我们任何关于每个动词的意思和特殊的使用模式,但是对于英语学习者来说,当他们想表达损害或毁坏某件物体时,他们可以更多地使用“destroy”和“damage”这两个动词。

2.2. 文体

词汇的分布模式对于语言学习者来说非常重要。不同文体内,近义词分布频率不同,统计不同文体的词频差异能够促进学习者文体意识的培养,发现在特定文体用词优先原则,能宏观上指导近义词辨析。因此这三个近义动词的文体研究对于英语学习者来说相当有意义。本文通过COCA语料库的图表显示检索了“destroy”,“damage”和“ruin”在不同文体中的出现频数和每百万词的频率,得出了表2的数据。

Table 2. Word frequency in different styles

表2. 不同文体中的词频

上述数据表明:1) 在各个文体中,“destroy”的使用均高于“damage”和“ruin”,而且在各个语域的词频波动不大,表明“destroy”在各个语境都适用;2) “damage”在报纸这一文体中词频高达12,528,远远超过在其他四个语域中的词频,这表明该词适合用于官方报道;3) “ruin”一词在学术文体中使用频率最低,表明“ruin”一词常用于非正式文体。由此可见,通过调查近义动词在不同文体中的分布频率,可以发现近义词在不同文体中的优先用词原则,以便用语更加地道。

2.3. 搭配

搭配,即词的典型组合,是指在文本中实现一定的非成语意义并以一定语法形式因循组合使用的一个词语序列 [9] 。Firth曾指出“You shall know a word by the company it keeps” [10] 。也就是说,通过搭配词,我们可以很好地对一个词进行理解和研究。本文通过COCA对近义词“destroy”,“damage”和“ruin”进行搭配检索,寻找这三个词前后出现频率较高的词。同一个搭配词出现的频率越高,表明其与目标词的关联性越强,搭配强度越大。本文还将利用MI值为参考对搭配强度进行分析。所谓MI值(Mutual Information Score)就是将两个词同时出现的可能性和单独出现的可能性相比较,如果MI值为0,那就意味着这两个词基本不搭配在一起;如果MI值大于3或更高,就意味着这两个词经常在一起出现,也就是互相搭配。MI值越大,说明节点词对其词汇环境影响越大,对其共现词吸引力越强。

2.3.1. 与介词搭配

众所周知,动词常常和介词搭配。在之前提到的词典当中,这三个动词均不和介词搭配使用。在语料库中这三个单词是不是也是如此使用?作者在“COLLOCATION”一栏中输入“[i*]”,把左边搭配的数量降低为0,右边的搭配数量设定为4,所有的数据都按“RELEVANCE”从大到小排列,这样就能得出这三个近义动词与各个介词搭配的频率和MI值。表3因为篇章有限只列出了前5个MI值最高的与这三个近义动词搭配的介词。

表3可见,三个近义动词与各个介词的相关性都不高,大部分搭配的MI值在0左右,甚至低于0,也就是说这三个近义动词几乎不与介词搭配。参见COCA语料库所给例句:

1) We will also destroy those defense systems without hesitation.

2) What if you damage it at all during the process?

3) I wasn’t going to ruin that progress by greeting new clients without his permission.

从以上例句可以看出,虽然这三个动词会与一些介词同时出现在同一个句子中,但它们并不和介词搭配。

Table 3. The first five prepositions collocated with the three verbs

表3. 前5个分别和三个动词搭配的介词

2.3.2. 与名词搭配

在词典中,“destroy”是及物动词,“damage”和“ruin”既可以作为及物动词也可以作为不及物动词。为了降低可变性、更科学地比较这三个近义动词,笔者将这三个动词在都作为及物动词的情况下进行比较。将“[nn*]”输入“COLLOCATION”一栏中,左边的单词数量设为0,右边的单词数量设为4,所有的数据都按“RELEVANCE”从大到小排列。并且所有的搭配名词都以“LEMMAS”的形式表现出来,即把一个名词的单数和复数形式归为一个词条。

为了更好地分析数据,笔者将这三个近义动词所搭配的名词分为具体名词和抽象名词。从这些数据中我们可以得出,“destroy”多和具体名词搭配,且与战争有关的名词多和“destroy”搭配,例如,“warhead”、“missile”、“enemy”、“arsenal”等。和“damage”搭配的名词大部分为具体名词,且在这些具体名词中,与身体构造相关的名词频频出现,如“kidney”、“artery”、“liver”、“nerve”、“organ”、“DNA”、“vessel”、“lung”、“brain”等。“ruin”多和抽象名词搭配,很少和具体名词搭配。例如,“reputation”、“appetite”、“friendship”、“happiness”等。下面的三个图表(表4~6)因为篇章有限只列出了前20个MI值最高的与这三个近义动词搭配的名词。

Table 4. The first 20 nouns combined with “destroy”

表4. 前20个和“destroy”搭配的名词

Table 5. The first 20 nouns combined with “damage”

表5. 前20个和“damage”搭配的名词

Table 6. The first 20 nouns combined with “ruin”

表6. 前20个和“ruin”搭配的名词

2.4. 语义韵

Louw在1993年正式运用“语义韵”这一术语,他把语义韵定义为“一个词汇的意义的氛围受它的搭配影响” [11] 。简单来说,语义韵即词汇的一种搭配倾向性,它们习惯性地吸引具有相同或相似语义特点的词项,与之构成搭配关系。词语搭配形成的语义韵大体上可分为消极语义韵、中性语义韵和积极语义韵三类 [12] 。近义词辨析中,语义韵概念的引入对于确定近义词的态度标识功能起到了很好的解释作用 [13] 。

由COCA语料库所提供的数据可见(以表四、表五和表六为例),三个近义动词的搭配名词基本没有表现出积极的语义韵。“destroy”的搭配名词有一部分表达出中立的语义韵,如“microorganism”、“bacteria”、“enzyme”等,另一部分表达出消极的语义韵,如“livelihood”、“civilization”等。而与“damage”、“ruin”的搭配名词绝大部分表达出消极的语义韵,比如,它们均可与“reputation”等搭配。

3. 总结

文章通过语料库研究方法,借助COCA语料库,对近义词“destroy”,“damage”和“ruin”进行了出现频数、文体分析、搭配词和语义韵等四个方面的研究。得出如下结论:首先,“destroy”的词频在总体上最高,这意味着“destroy”是我们在表达损害或毁坏某件物体时最常用的一个单词。其次,从文体的角度来看,“destroy”在各个语境都适用,“damage”多用于官方报道,而“ruin”常用于非正式文体。第三,“destroy”、“damage”和“ruin”这三个近义动词都几乎不和介词搭配。“destroy”多和具体名词搭配,且与战争有关的名词多和“destroy”搭配,和“damage”搭配的名词大部分为具体名词,其中绝大多数和身体结构有关,“ruin”多和抽象名词搭配。最后,这三个动词基本上没有表现出积极的语义韵。总而言之,语料库研究方法为近义词的区分提供了高效、快捷、准确的方式。对于英语学习者在英语择词上的具体考量起到了极大的帮助作用,而这一帮助也是极具说服力的。

文章引用

卓淑敏. 基于COCA语料库的近义动词辨析——以Destroy,Damage和Ruin为例
COCA Corpus-Based Study of the Near-Synonymous Verbs—Taking “Destroy”, “Damage” and “Ruin” for Reference[J]. 现代语言学, 2019, 07(01): 27-33. https://doi.org/10.12677/ML.2019.71005

参考文献

  1. 1. 贺晓东. 英语同义词词典[M]. 北京: 商务印书馆, 2003.

  2. 2. 杨慧中. 语料库语言学导论[M]. 上海: 上海外语教育出版社, 2002.

  3. 3. 杨春霞. 基于语料库的近义词辨析研究——以suspect和doubt为例[J]. 西南科技大学学报: 哲学社会科学版, 2014, 10(5): 45.

  4. 4. Hanks, P. (1996) Contextual Dependency and Lexical Sets. International Journal of Corpus Linguistics, 1, 75-98. https://doi.org/10.1075/ijcl.1.1.06han

  5. 5. Dilin, L. (2010) Is It a Chief, Main, Major, Primary, or Principal Concern? A Corpus-Based Behavioral Profile Study of the Near Synonyms. International Journal of Corpus Linguistics, 15, 56-87. https://doi.org/10.1075/ijcl.15.1.03liu

  6. 6. 郭放, 翟红华. 基于语料库的“affect”的类联接对比研究[J]. 语文学刊(外语教育教学), 2012(10): 19 -20.

  7. 7. 梅一馨. 基于语料库关于词性转换对语义韵影响的研究——以affect/effect和influence为例[J]. 兰州教育学院学报, 2015(1): 97-99.

  8. 8. 英国朗文出版公司. 朗文当代英语词典[M]. 北京: 世界图书出版公司, 1993.

  9. 9. 卫乃兴. 专业性搭配初探——语料库语言学的方法[J]. 解放军外国语学院学报, 2001, 24(4): 19-23.

  10. 10. Firth, J. (1957) Modes of Meaning. In: Firth, J., Ed., Papers in Linguistics 1931-195l, Oxford University Press, New York.

  11. 11. Louw, B. (1993) Irony in the Text or Insincerity in the Writer? The Diagnostic Potential of Semantic Prosodies. In: Francis, M. and Tognini-Bonelli, E., Eds., Text and Technology: In Honor of John Sinclair, John Benjamins, Philadelphia and Amsterdam. https://doi.org/10.1075/z.64.11lou

  12. 12. Stubbs, M. (1995) Collocations and Semantic Profiles: On the Cause of the Trouble with Quantitative Studies. Functions of Language, 2, 23-55. https://doi.org/10.1075/fol.2.1.03stu

  13. 13. 张继东, 刘萍. 基于语料库同义词辨析的一般方法[J]. 解放军外国语学院学报, 2005, 28(6): 53-56.

期刊菜单