Modern Linguistics
Vol. 06  No. 04 ( 2018 ), Article ID: 26739 , 8 pages
10.12677/ML.2018.64067

A Corpus-Based Study of Synonyms by Chinese EFL Learners

—A Case Study of Start, Begin and Commence

Jia Li, Yun Xia

School of Translation Studies, Qufu Normal University, Rizhao Shandong

Received: Aug. 23rd, 2018; accepted: Aug. 31st, 2018; published: Sep. 7th, 2018

ABSTRACT

Based on native speakers’ corpus BNC and non-native speakers’ corpus CLEC, this study investigates the collocation of synonyms, begin, start and commence produced by the Chinese EFL learners. The study finds that: There are differences in the use of synonyms for the Chinese EFL learners. Difficulties occur in differentiating synonym collocations. The Chinese EFL learners tend to use fixed collocation. This study explains that these problems are closely related with the fact that the Chinese EFL learners tend to translate literally in accordance with Chinese collocation, and that learners tend to adopt avoidance strategy due to the lack of contextual awareness and the knowledge of collocational behavior.

Keywords:Collocation, Chinese EFL Learners, Synonymous

基于语料库的英语学习者同义词搭配行为研究

—以Start、Begin、Commence为例

李佳,夏云

曲阜师范大学翻译学院,山东 日照

收稿日期:2018年8月23日;录用日期:2018年8月31日;发布日期:2018年9月7日

摘 要

本研究对比英语国家语料库(BNC)与中国学习者英语语料库(CLEC)中begin、start和commence的使用情况,考察同义词的语义搭配行为。研究发现,中国英语学习者在这三个同义词的使用习惯上存在差异,在区别其搭配行为上也存在偏离英语常规现象,且搭配形式较为单一,更倾向于使用固定搭配形式。研究认为,一方面中国英语学习者很可能受母语汉语搭配习惯影响,倾向于按照汉语搭配习惯逐词翻译,另一方面说明中国英语学习者对同义词搭配行为知识掌握欠缺,对习得的二语不能在语境中灵活运用,倾向采用回避策略。

关键词 :搭配,中国英语学习者,同义词

Copyright © 2018 by authors and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

1. 引言

同义词指的是具有不同音形却有相同或相似意义的词 [1]。传统语义学认为,同义词具有相同的外延意义,可以相互替换。但绝对的同义词并不多 [2]。语料库证据表明,每一个词项都有其独特的搭配行为 [3]。同义词也不例外,它们一般只在概念意义上相同或接近,但在搭配词选择上并不能随意替换 [4]。例如,在英语中powerful car和strong tea是典型搭配,而powerful tea和strong car则不符合英语表达习惯 [5]。因此中国英语学习者正确辨析英语同义词成为英语学习的关键。

词语搭配指的是词与词的结伴使用这种语言现象。语言中词汇并非单独、孤立使用,而是和其他词构成习惯性和典型性的结伴关系一起使用。根据 [6],“词语搭配是在文本中实现的一定的非成语意义并以一定的语法形式因循组合使用的一个词语序列,构成该序列的词语相互预期,以大于偶然的几率共现”。研究者 [3][7][8]常常使用“搭配行为”来描述搭配词分布和语义特征。本文亦沿用该术语对同义词进行描述。

近年来,国内基于语料库的英语同义词研究逐步开展。现有研究多聚焦于同义词的语法搭配特征。张继东、刘萍 [9]通过统计happen、occur和“发生”在语料库的不同语域中的词频分布差异,观察检索行中所呈现的不同搭配关系、类联结等语言特征。部分学者 [10][11][12][13]通过类联结手段对start、begin这组英语同义词后搭配不定式和动词ing这两类非限定补语结构进行了相关探索。但是,针对同义词探讨其语义搭配行为的研究相对较少,而且对中国英语学习者的英语同义词使用情况及其影响因素的讨论不够深入。

本研究考察英语同义词的搭配行为,归纳搭配词所属分类情况,对比英语本族语者和中国英语学习者在start、begin和commence上的使用习惯和搭配行为,以期对中国英语学习者在同义词差异辨析方面能够起到一定的指导作用。

2. 研究设计

2.1. 研究问题

本研究选取start、begin和commence三个同义词进行比较,现有词典对三个词的定义基本是to begin or start doing something。根据定义可知,三个同义词的解释都包含了“开始做某事”的意思,但难以看出同义词之间的内部结构和细微差异。start、begin和commence三个同义词是否意义完全对等、用法完全相同呢?英语本族语者与中国英语学习者使用这三个同义词是否存在差异呢?从词典的解释很难得到答案。因此,本研究试图回答以下三个问题:1) 英语本族语者的同义词搭配行为特征如何?2) 中国英语学习者在英语同义词的搭配行为上呈现出何种特点?3) 影响中国英语学习者的英语同义词使用的主要因素有哪些?

2.2. 研究工具

本研究以中国学习者英语语料库(Chinese Learner English Corpus,简称CLEC) [14]为研究对象,库容为100万词,主要关注中国英语学习者对汉语中与“开始”字面意义最为接近的英语同义词start、begin和commence的搭配行为。

此外,本研究还使用了英语国家语料库(British National Corpus,简称BNC)和兰卡斯特汉语语料库(The Lancaster Corpus of Mandarin Chinese,简称LCMC)作为参照。BNC语料库词容量超过一亿,能够较好地体现以英语为母语的本族语者的语言特点。为保持语料的平衡性,本研究选取了同义词start、begin 和commence在BNC语料库书面语部分的语料作为参照,且该组同义词基本都高频出现。因此,能够在一定程度上反映本族语者的同义词语义搭配行为,为对比中国英语学习者英语同义词的使用情况提供更丰富的数据支撑。LCMC语料库是一个100万词次(按每1.6个汉字对应一个英文单词折算)的现代汉语书面语通用型平衡语料库,可统计中国英语学习者对母语汉语“开始”的使用情况,观察母语汉语对学习者辨析英语同义词的影响。AntConc 3.2.2语料库分析软件为本研究的检索工具。

2.3. 研究步骤

本研究分别从BNC语料库和CLEC语料库中提取真实数据,分析start、begin和commence的典型搭配词,关注同义词的搭配行为,因此在搭配词的选取上仅考虑实义搭配词。

首先,从BNC语料库和CLEC语料库分别检索start、begin和commence三个节点词。为便于考察三个节点词的语义搭配行为,检索项涵盖三个词的屈折变化形式。然后,按搭配词出现频率高低检索出前100位搭配词,人工分析三个节点词与搭配词共现的索引行,剔除重复行和不符合义项要求的部分,再对其有效索引行的搭配词进行定性分类,归纳为以下9类:时间类(如season、holiday)、动作类(如dig、scratch)、评价类(如inauspicious、humble)、状态类(如crumble、fade)、工具类(如engine、wiper)、心理类(如panic、realize)、事件类(如intifada、competition)、价格类(如price)及其他。最后,基于BNC和CLEC研究结果,对比分析本族语者和中国英语学习者对该三个节点词搭配行为的使用差异,并探讨差异出现的原因。

3. 研究结果

3.1. 同义词的分布

分析结果显示,英语本族语与中国英语学习者对三个节点词在使用频率上存在差异(见表1)。在BNC语料库中,start出现频率最高,begin次之,commence最低。而CLEC语料库中显示,begin出现频率最高,start次之,commence最低。

我们采用对数似然比,对三个节点词在两个语料库中的频率进行了对比分析。研究发现,三个节点词的使用频率皆具有显著差异(见表2),英语本族语者对start和commence的使用频率显著高于英语学习者,而在中国英语学习者语料库中begin的使用频率显著高于BNC语料库。

3.2. 同义词的搭配特征

BNC语料库结果显示,各节点词的搭配词分类情况存在差异(见图1)。start有效索引行为2081,begin

Table 1. The frequency of start, begin and commence in BNC corpus and CLEC corpus

表1. Start、begin、commence在BNC语料库和CLEC语料库中的出现频率

Table 2. Likelihood ratio analysis of differences in start, begin and commence usage in BNC corpus and CLEC corpus

表2. BNC和CLEC语料库中start、begin、commence使用差异的似然率分析

注:“+”表示在BNC语料库中高频使用;“-”表示在CLEC语料库中高频使用。

Figure 1. Distribution of collocation words of start, begin and commence in BNC corpus

图1. BNC语料库中start、begin、commence搭配词分布情况

有效索引行为1601,commence有效索引行为625。

以上数据显示,start搭配词搭配范围最广,与时间类搭配词搭配使用频率最高。start与动作类搭配词搭配的使用情况明显高于状态类搭配词的使用,与评价类、工具类和事件类搭配词搭配的使用情况也较多。begin与时间类搭配词搭配使用最多,且与状态类搭配词搭配的使用情况明显高于动作类搭配词的使用,与start相反。此外,begin与心理搭配词搭配的使用情况也较多,但与评价类、事件类搭配词搭配使用情况较少。值得注意的是,begin没有出现与工具类、价格类搭配词搭配情况。commence的搭配词分类范围相对较少,主要与状态类、事件类搭配词搭配,动作类次之,与时间类搭配词搭配使用情况最少。

CLEC语料库结果显示,各节点词的搭配词分类情况存在差异(见图2)。start得到的有效索引行为162,begin为739,commence则仅有4例。

以上数据显示,中国英语学习者在使用start时,搭配词搭配范围最广。start与状态类搭配词搭配的使用频率最高,高于动作类搭配词的使用,也常与评价类搭配词搭配。start存在与时间类、工具类、心理类、事件类搭配词搭配使用情况,但使用频率不高。从start搭配词分类情况可以看出,“其他类”使用频率较高,主要是指固定搭配的形式出现,如from start to end。begin主要与状态类搭配词搭配,高于动作类搭配词的使用频率,也常与事件类、时间类、心理类搭配词搭配,但与评价类搭配词搭配使用情况较少。同样,begin的“其他类”使用频率较高,也常以固定搭配的形式出现,如from beginning to end。commence在CLEC语料库中只出现了四次,其搭配词分别为动作类actions,状态类concern about和damage以及事件类policy,使用频率很低。

4. 讨论

4.1. 英语本族语者与中国英语学习者同义词搭配行为异同

对比英语本族语者与中国英语学习者对start、begin、commence的使用情况,可知两者对于该组同义词使用习惯上存在差异。英语本族语者倾向使start一词,而中国英语学习者则更多地使用begin,很少使用commence。

中国英语学习者在区别同义词的搭配行为上存在偏离英语常规现象,主要表现为start与commence的搭配词。start主要是与动作类搭配词搭配,但学习者却常将其与状态类搭配词搭配,见下例:

1) We’ve got to start digging in and dish out some of the rough stuff. (BNC)

2) And once more the other rats started their scratching and squeaking. (BNC)

3) If they change the job, they must start to learn so many things. (CLEC)

BNC语料库中,start与动作类、状态类搭配词搭配频率分别为16.43%、4.32%,更倾向与动作类搭配词搭配,如例(1)、例(2)中的dig、scratch。而CLEC语料库中,start与动作类、状态类搭配词搭配频率分别为16.05%、27.78%。统计分析显示,CLEC语料库中start与状态类搭配词的使用与其在BNC语料库中相比具有显著差异(Log-likelihood 78.15; Sig. 0.000***)。中国英语学习者使用start时更倾向与状态类搭配词搭配,且主要与work、read、learn搭配。从BNC语料库中检验学习者使用状态类典型搭配词情况,发现英语本族语者使用start一词时,与read、learn搭配使用频率低。由此可知,中国英语学习者在区别start搭配行为上出现偏离英语常规现象。

中国英语学习者在使用commence一词时也存在问题。commence主要用于正式语体中,但学习者在使用该词时缺乏语体差异敏感度,存在搭配异常现象,出现搭配错误,见下例:

4) The defendant did not commence proceedings against the appellant until 7 March 1988. (BNC)

5) … the development of industrial civilization which started in 16th century, man commenced to damage nature. (CLEC)

6) … since 1978 when reform and open were commenced. (CLEC)

BNC语料库中,commence与事件类搭配词搭配频率较高,达到总频率的27.20%,其中法律文本约占事件类搭配词的81.65%,且以搭配词proceedings为主,在语境中指“诉讼”。CLEC语料库中,commence使用频率很低,仅出现4次。中国英语学习者在使用该词时有时会将其用于非正式文体中(见例5)。此外,

Figure 2. Distribution of collocation words of start, begin and commence in CLEC corpus

图2. CLEC语料库中start、begin、commence搭配词分布情况

学习者在使用该词时,常产出错句,不能正确使用(见例6)。可见,相比commence一词,中国英语学习者更习惯使用start、begin这两个表示“开始”意义的词,对其熟悉程度高。

此外,中国英语学习者倾向于高频使用单个动词,而短语动词的使用频率明显偏低,使用单个动词替代短语动词的倾向尤为明显 [15]。使用短语动词时,常以固定搭配的形式出现,见下例:

7) So they started. (CLEC)

8) Some people like taking up a job from the start to the end. (CLEC)

9) At the beginning, we can't master the way of playing them. (CLEC)

CLEC语料库中,start作为动词独立使用(见例7)以及以固定搭配形式(见例8),出现频率达25.31%。而begin作为固定搭配形式,出现频率达19.35%,如例(9)中的at the beginning以及常见的其他固定搭配形式(如from beginning to end)。

4.2. 原因分析

中国英语学习者在使用 begin、start和commence 这组同义词时主要存在以下问题:区别同义词的搭配行为上存在偏离英语常规现象,缺乏语体差异敏感度,出现搭配异常现象。本文从以下三个方面进行探讨:

1) 中国英语学习者受母语汉语搭配习惯影响,倾向按照汉语搭配习惯逐词翻译。二语习得研究表明,学习者不可避免地要借助母语来理解和表达。当目标语知识不能满足交际需求时,他们倾向于寻找翻译对等之间的联系借助母语系统表达意思 [16][17][18][19]。绝大部分的学习者基本固化在由母语语义和句法知识占位的“母语媒介”阶段,即母语知识在二语加工过程中起到重要作用(正负两方面) [20]。也有学者 [21][22]指出,学习者对目标语掌握不熟练是由母语干扰造成的。为进一步观察母语干扰对学习者使用英语同义词的影响,本研究考察了LCMC语料库中中国英语学习者对母语汉语“开始”的使用情况(见图3)。

数据表明,中国英语学习者使用start、begin、commence三个节点词的搭配习惯上存在一定对应性。“开始”主要与状态类搭配词搭配使用,其次为时间类、评价类、动作类。由此可知,中国英语学习者受母语汉语搭配习惯影响,且受词汇量等方面的限制,往往超用一些与汉语搭配相同的英语搭配结构。比如,使用start时,与状态类搭配词搭配使用频率最高。这也解释了中国英语学习者与本族语者在使用start时搭配习惯存在差异的原因。由此看出,中国英语学习者对同义词的语义搭配行为受母语负迁移的影响,容易通过语法模式把对应母语的搭配语义迁移到目标语中,导致中国英语学习者对英语同义词的使用上与英语本族语者使用情况出现差异。

Figure 3. Comparison of the distribution of collocation words of “kaishi” in LCMC corpus and CLEC corpus

图3. LCMC与CLEC“开始”类搭配词分布情况比较

2) 中国英语学习者倾向采取回避策略。回避现象是学习者在外语学习过程中存在的一个很重要的语言心理现象,学习者常见的回避现象有词汇回避、句型回避和语用层面的回避等。由于语言知识的匮乏,英语学习者在写作过程中往往过多采用回避策略 [23]。CLEC语料库的数据主要采集自CET写作考卷的作文,所以英语学习者为了追求高分、顺利完成写作任务,出现过度使用单个动词这一简单形式替代短语动词的倾向,以此来避免错误以及确保写作的准确性和得体性,限制了考生能力的充分发挥。CLEC语料库中,commence该节点词只出现了四次,使用频率极低。这表明中国学习者的对该节点词掌握的搭配知识有限,能正确产出的搭配结构也有限,体现了回避策略的使用与学习者的英语熟练程度成负相关 [23]。此外,中国英语学习者使用start、begin、commence该组同义词时,出现异常搭配现象也与整体性策略和分析性策略使用有关。整体性策略指的是当学习者缺乏合适的表达方式时,倾向于用一个意义接近的词项来替代;分析性策略指学生采用婉转曲折的方式间接表示想要表达的意思 [22]。这也解释了EFL学习者英语中语义不当等异常搭配主要是过度替代所产生 [24]。

3) 中国英语学习者对同义词搭配行为知识掌握欠缺,缺乏语境意识,不能对习得的二语在语境中灵活运用。学习者所掌握的搭配结构数量有限、搭配能力弱、搭配变化度低,没有英语本族语者丰富多变,这也解释了学习者高频使用单个动词的现象。此外,学习者忽视了语境中节点词与搭配词共现的搭配特征,对于词汇在不同语体中的使用缺乏语体差异敏感度。例如,节点词commence主要用于正式语体中,但学习者在使用该词时却将其用于非正式语体中,导致了EFL学习者英语中语义不当等异常搭配现象。通过分析中国英语学习者对同义词的使用情况,体现了学习者在词频广度、词汇多样性、词汇的语体特征等方面存在不足 [25]。

5. 结语

本文以CLEC语料库为基础,对比BNC语料库,研究中国英语学习者在使用 begin、start和commence 这组同义词时与英语本族语者的差异。结果发现:1) 学习者在同义词使用习惯上存在差异;2) 学习者在区别同义词搭配行为上存在偏离英语常规现象;3) 学习者使用同义词时搭配能力弱、搭配变化度低,更倾向于使用固定搭配形式。究其原因,一方面与中国英语学习者受母语汉语搭配习惯影响,倾向于按照汉语搭配习惯逐词翻译密切相关;另一方面说明中国英语学习者对同义词搭配行为知识掌握欠缺,对习得的二语不能在语境中灵活运用,倾向采用回避策略。

本研究发现对进一步探讨中国英语学习者英语同义词及其翻译对应词的搭配行为特征具有借鉴价值,对同义词教学研究也具有一定的启示意义。当然,本研究也不可避免地存在一些局限性。一是在对同义词的搭配词进行语义类别判定的过程中,研究者的主观因素也会导致误差,这些都有待未来的研究进一步验证。二是中国英语学习者语料的取样来自CLEC语料库,该语料库与BNC语料库相比,库容相对较小,EFL学习者的同义词搭配特征可能不会全面展示。因此,未来的研究建议基于更大的学习者语料库进行。

致谢

感谢导师夏云教授的严谨指导,感谢编辑部及匿名审稿人的宝贵意见。

基金项目

项目名称:翻译硕士兼职导师立体管理模式构建;项目编号:SDYY17143;项目类别:山东省研究生导师指导能力提升项目;项目时间:2017年9月至2020年9月。

文章引用

李 佳,夏 云. 基于语料库的英语学习者同义词搭配行为研究
A Corpus-Based Study of Synonyms by Chinese EFL Learners[J]. 现代语言学, 2018, 06(04): 573-580. https://doi.org/10.12677/ML.2018.64067

参考文献

  1. 1. Fromkin, V. and Rodman, R. (1993) An Introduction to Language. 5th Edition, Holt, Rinehart and Winston, New York.

  2. 2. Crystal, D. (1987) The Cambridge of Encyclopedia of Language. Cambridge University Press, Cambridge.

  3. 3. Partington, A. (1998) Patterns and Meanings-Using Corpora for English Language Research and Teaching. John Benjamins, Amsterdam.
    https://doi.org/10.1075/scl.2

  4. 4. Conzett, J. (1997) Integrating Collocation into Reading and Writing Course. In: Coady, J. and Huckins, T., Eds., Second Language Vocabulary Acquisition, Cambridge University Press, Cambridge, 70-87.

  5. 5. Halliday, M.A.K. (1976) System and Function in Language. Oxford University Press, Oxford.

  6. 6. 卫乃兴. 词语搭配的界定与研究体系[M]. 上海: 上海交通大学出版社, 2002.

  7. 7. Xiao, R. and McEnery, T. (2006) Collocation, Semantic Prosody, and Near Synonymy: A Cross-Linguistic Perspective. Applied Linguistics, 27, 103-129.
    https://doi.org/10.1093/applin/ami045

  8. 8. 卫乃兴. 基于语料库学生英语中的语义韵对比研究[J]. 外语学刊, 2006(5): 50-55.

  9. 9. 张继东, 刘萍. 动词happen、occur 和“发生”的语言差异性探究——一项基于英汉语料库的调查与对比分析[J]. 外语研究, 2006(5): 19-22.

  10. 10. Eicha, V. (1987) Notes on Infinitival and -ing Participle Complements of the Verbs Begin and Start. Philologica Pragensia, 30, 129-133.

  11. 11. Mair, C. (2003) Gerundial Complements after Begin and Start: Grammatical and Sociolinguistic Factors, and How They Work against Each Other. Topics in English Linguistics, 43, 329-346.
    https://doi.org/10.1515/9783110900019.329

  12. 12. Nagy, T. (2008) Begin and Start: Aspect and Complement Choice. Bucharest Working Papers in Linguistics, 1, 69-77.

  13. 13. 庞杨, 杨玉晨. 语料库对同义词触发模式的解释: 以begin、start和commence为例[J]. 外语与外语教学, 2012(6): 21-25.

  14. 14. 桂诗春, 杨惠中. 中国学习者英语语料库[M]. 上海: 上海交通大学出版社, 2003.

  15. 15. 陆军. 基于语料库的学习者英语近义词搭配行为与语义韵研究[J]. 现代外语, 2010(3): 276-286.

  16. 16. Kroll, J. and Stewart, E. (1994) Category Interference in Translation and Picture Naming: Evidence for Asymmetric Connections between Bilingual Memory Representations. Journal of Memory and Language, 1, 149-174.
    https://doi.org/10.1006/jmla.1994.1008

  17. 17. Jarvis, S. and Pavlenko, A. (2008) Cross-Linguistic Influence in Language and Cognition. Routledge, New York.

  18. 18. 桂诗春. 以语料库为基础的中国学习者英语失误分析的认知模型[J]. 现代外语, 2004(2): 129-139.

  19. 19. 陆军, 卫乃兴. 共选视阙下的二语知识研究——项语料库驱动的使役态共选特征多重比较[J]. 外语界, 2013(3): 2-11.

  20. 20. Jiang, N. (2000) Lexical Representation and Development in a Second Language. Applied Linguistics, 1, 47-77.
    https://doi.org/10.1093/applin/21.1.47

  21. 21. Newmark, L. (1966) How Not to Interfere with Language Teaching. International Review of American Linguistics, 40, 77-83.

  22. 22. James, C. (2001) Errors in Language Learning and Use: Exploring Error Analysis. Beijing Foreign Language Teaching and Research Press, Beijing.

  23. 23. 王金巴. 大学生英语写作中的回避现象调查研究[J]. 外语教学, 2010(3): 55-59.

  24. 24. Howarth, P. (1998) The Phraseology of Learners’ Academic Writing and Second Language Proficiency. In: Cowie, A.P., Ed., Phraseology: Theory, Analysis, and Applications, Oxford University Press, Oxford, 161-186.

  25. 25. 文秋芳. 英语专业学生使用口语-笔语词汇的差异[J]. 外语与外语教学, 2006(7): 9-13.

期刊菜单