Modern Linguistics
Vol. 11  No. 06 ( 2023 ), Article ID: 68182 , 10 pages
10.12677/ML.2023.116359

题目结构类型对汉语二语写作词汇产出的影响研究

张丹丹,王嘉夫

鲁东大学文学院,山东 烟台

收稿日期:2023年5月15日;录用日期:2023年6月20日;发布日期:2023年6月30日

摘要

相同词汇水平的汉语学习者在写作中产出词汇的情况并不一致,且在面对不同结构类型的题目时,产出的词汇水平也存在差异。本文从题目结构类型入手,从词汇多样性、词汇复杂性、词汇密度、词汇错误四个方面评估二语学习者的产出词汇,通过研究汉语二语学习者写作题目结构类型与产出词汇的关系,使题目结构类型差异导致的产出词汇差异具象化。研究结果表明,限制题目结构开放度能够显著提升学习者产出词汇多样性,开放度高的题目更利于名词、代词的产出,而开放度低的题目更利于动词、形容词、副词、数词的产出。

关键词

题目结构类型,产出词汇

Study on the Influence of Essay Topic Structure Types in L2 Written Vocabulary Production

Dandan Zhang, Jiafu Wang

College of Chinese Language and Literature, Ludong University, Yantai Shandong

Received: May 15th, 2023; accepted: Jun. 20th, 2023; published: Jun. 30th, 2023

ABSTRACT

Chinese learners with the same vocabulary level produce different vocabularies in their writing, and there are also differences in the level of vocabularies produced while facing questions of different structural types. Starting from the topic structure types, this paper evaluates the output vocabularies of second language learners from four aspects: lexical diversity, lexical complexity, lexical density, and lexical accuracy. By studying the relationship between the structural types of writing questions and the produced vocabularies of Chinese second language learners, the differences in produced vocabularies caused by the differences in the structural types of questions can be concreted and provided a reference for the teaching of Chinese second language writing. The results show that limiting the openness of topic structure can significantly improve the lexical diversity of learners’ output. Questions with high openness are more conducive to the output of nouns and pronouns, while questions with low openness are more conducive to the output of verbs, adjectives, adverbs and numerals.

Keywords:Topic Structure Types, The Output Vocabularies

Copyright © 2023 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

写作受文本中多种因素影响,但程度并不相同。Laufer和Nation认为不考虑其他因素,如果词汇运用得好,自然就是一篇好作文 [1] 。Astika考察了词汇、内容、语言运用、结构、策略运用对写作成绩的影响,发现词汇因素影响最大,占83.75% [2] 。Santos、Nation等的研究也表明,词汇对分数的影响最大 [3] [4] 。胡明扬 [5] 提出语言本质上是由词语组合而成,语法知识和语音并不是抽象的孤立存在,而是依附在词语之上。因此,词汇的学习对于二语学习来说非常重要。词汇水平是评价写作质量非常重要的一个方面 [6] 。此外,Swain [7] 的可理解输出假说认为,学习者不仅需要可理解的输入,还需要可理解的输出,输出也是促进二语习得的重要方式。

那么怎么促进二语词汇产出呢?二语学习者的词汇产出受本身掌握词汇多寡的影响,但我们在教学中发现,同样词汇水平的汉语学习者在写作中产出词汇的情况并不一致,且在面对不同结构类型的题目时,产出词汇水平也存在差异。这是由什么引起的呢?这吸引我们观察写作题目结构类型对写作词汇产出的影响。

基于上述困惑,本文拟开展题目结构类型差异对二语作文词汇产出的影响研究,其研究对象为汉语二语学习者在不同结构类型题目写作中所产出的词汇,尝试解决下述问题:

写作题目结构类型的不同是否对汉语学习者的词汇产出有影响?假设有影响,那么写作题目结构类型的不同对汉语学习者的词汇产出有何影响?在写作教学中应该如何设定写作题目类型更利于刺激词汇产出?

由于初级水平的汉语学习者很难用汉语完成完整的写作任务,从而无法对本研究关注的问题进行详细考察,因此我们将研究对象确定为中高级汉语学习者。

2. 研究设计

采用不同的测量指标分析汉语二语学习者的语言特征,可以从不同的角度了解其语言产出的情况。由于HSK语料库的语料比较复杂,测量指标和方法纷繁多样,在统计和分析数据之前,需要先界定本文词汇多样性、词汇复杂度、词汇密度、词汇错误的操作性定义及其测量,梳理题目类型并进行作文题目类型分类。

2.1. 词汇研究各维度的操作性定义及其测量

2.1.1. 词汇多样性的操作性定义及测量方法

词汇多样性指非重复词语在文章中的比重 [8] 。本研究使用UberIndex来测试作文词汇多样性,这个公式提供了相对精确的测量词汇多样性的方法,且受文本长度的影响较小,公式如下:

Uberindex = U = (logtokens)2/(log tokens − log types)

具体操作步骤:将文本用Corpuswordparser进行分词处理,经过逐篇人工校正分词后,用Antwordprofiler对每个文本的形符和类符逐篇进行统计,然后用EXCEL计算每个文本的Uber指数,以此作为词汇多样性的参考依据。

2.1.2. 词汇复杂性的操作性定义及测量方法

词汇复杂性考察的是写作者使用的有难度的词语,具体指低频词语在文章中所占的比例。我们选择用词频概貌来反映词汇复杂性。本文使用Read [8] 的方法,同时统计不同词频等级中的词语数量。在对汉语作文语料进行分词处理后,人工修正词汇等级归类,运用于汉语各级词汇分布的计算与考察。

具体操作步骤:分词后,将文本中的词汇用“汉语助研” [9] 软件逐篇进行统计,得到每一篇作文文本的产出词汇在HSK1-HSK9的每个等级的数量以及超纲词的数量,再通过使用EXCEL逐篇计算出使用该等级词汇在该文本总词汇量的占比,以此来表示词汇等级分布情况。

2.1.3. 词汇密度的操作性定义及测量方法

词汇密度指文本中的实词数量在总词数中所占的比例 [10] 。词汇密度测量方法使用Ure [11] 的公式:词汇密度 = 实词数/总词数。

具体操作步骤:将语料使用Corpuswordparser进行分词和词性标注,对分词和词性标注进行人工校对后,通过EXCEL逐个计算各文本的实词数量、名词数量、动词数量、形容词数量、副词数量、代词数量、数词数量、量词数量,之后用各个词性的数量/总词数,得出总的词汇密度和各词性的词汇密度。

2.1.4. 词汇错误的操作性定义及测量方法

选词、搭配、词义错误都视为词汇错误 [6] 。Read通过计算词汇错误在总词数中的比重测量词汇错误 [8] 。“HSK动态作文语料库”中将词语的错误分为:错词、离合词错误、外文词错误、缺词、多词。我们通过统计以上不同类型的词汇错误在错误总量中所占的比重,来考察作文题目类型的不同对词汇错误产出率的影响。

具体操作步骤:通过HSK语料库中已标注的错误,并结合人工修改,使用EXCEL进行数据筛选,统计出500篇文本中每篇文章的错词、离合词错误、外文词错误、缺词、多词,使用EXCEL计算每篇作文文本各类型错误的比重。

2.2. 写作题目结构类型分类

HSK作文语料库共有写作题目26个,将HSK作文语料库的写作题目进行梳理,结合文本类型划分理论与雅思写作题目分类,将写作题目类型按开放度划分,在结构上分题目开放式和题目封闭式两种,如表1

Table 1. Topic structure form classification table

表1. 题目结构形式分类表

2.3. 语料选取

语料的选取至关重要,此过程直接影响统计数据的结果。本文选取样本主要出于以下考虑。

为保证数据的准确性,在题目的选择上,去除题目下语料总篇数少于100的语料,去除单篇字数少于200字的语料。在关于写作者国籍的选择上,如一个题目下所有文章均来自一个国家,则不选择该题目的语料。由于国籍为中国的作文语料无法确认是否为母语为汉语的人所写,所以去除国籍为中国的作文语料。

故,以汉语学习为主题,选择开放度高和开放度低的作文作为语料,其中开放度高的题目为《我学汉语是为了……》,开放度低的题目为《学习汉语的苦与乐》。我们首先将语料按照分数高低进行排列,然后参考成绩因素均衡选取100篇语料,总计200篇语料。

3. 研究结果

本文从词汇多样性差异、词汇复杂度差异、词汇密度和词汇错误差异四个方面,分析结构开放度不同的题目对词汇产出的影响。不同题目结构类型对词汇产出的影响,具体研究结果如下。

3.1. 词汇多样性差异

由于两个题目所产生的词汇样本的多样性优博指数不满足正态分布,故对其进行两独立样本非参数检验,结果显示,开放度不同的题目《我学汉语是为了……》和《学习汉语的苦与乐》产出词汇的多样性具有显著性差异(P < 0.01 < 0.05)。

对两题目作文的优博指数均值进行比较后,发现《我学汉语是为了……》产出词汇的多样性均值为19.29,《学习汉语的苦与乐》产出词汇的多样性均值为21.76,表明,题目开放度低的题目更利于词汇产出的多样性。

综上表明,题目开放度低的题目更利于词汇产出的多样性。

3.2. 词汇复杂性差异

将《我学汉语是为了……》和《学习汉语的苦与乐》中词汇的分布情况逐等级对比。

开放度不同的题目《我学汉语是为了……》和《学习汉语的苦与乐》产出词汇的复杂性样本差异显著性结果如表2所示。

Table 2. The questions with different degrees of openness tested by ANOVA produce a table of the significance of differences in vocabulary levels

表2. 由ANOVA检验的开放度不同的题目产出词汇各等级差异显著性表

结果显示,开放度不同的题目《我学汉语是为了……》和《学习汉语的苦与乐》产出词汇的复杂性在HSK3、HSK6、HSK7-9和超纲词上存在显著差异。

进一步对200篇样本分题目观察各级词汇在等级大纲的占比(如图1),发现在HSK3级水平上,《我学汉语是为了……》的产出词汇多于《学习汉语的苦与乐》产出词汇;在HSK6、HSK7-9以及超纲词上,《学习汉语的苦与乐》产出词汇多于《我学汉语是为了……》的产出词汇。分析表明,题目开放度低的题目比题目开放度高的题目更利于高水平词汇的产出。

综上,开放度不同的题目产出词汇的复杂性在HSK3、HSK6、HSK7-9和超纲词上存在显著差异。题目开放度低的题目比题目开放度高的题目更利于高水平词汇的产出。

3.3. 词汇密度差异

用spss27对各词类在总词汇里的占比情况进行了分析,其差异显著性结果如表3

对两组文本的实词进行差异显著性检测发现,题目开放度有差异的两组文本,在总的实词词汇密度上并无显著差异性。经过单样本T检验,两组样本的实词在总词数的占比不存在显著差异(sig值 = 0.974 > 0.05)。

Figure 1. Questions of openness difference produce a table of the proportion of words at each level in the grade syllabus

图1. 开放度差异的题目产出各级词汇在等级大纲内占比表

Table 3. Significance table of the proportion difference of each word category in the total vocabulary

表3. 各词类在总词汇里的占比差异显著性表

但进一步分析发现,题目开放度不同的两组样本,除量词在总词数里的占比不存在显著差异外,其他词性在总词数里的占比均存在显著差异。

进一步计算各词性占总词汇比例的平均值发现,在名词、代词的产出词汇上,《我学汉语是为了……》优于《学习汉语的苦与乐》;在动词、形容词、数词、副词的词汇产出上,《学习汉语的苦与乐》优于《我学汉语是为了……》(如图2所示)。

Figure 2. Proportion of words of different parts of speech to total words

图2. 各词性词汇占总词汇比例图

综上,在名词、代词的产出词汇上,开放度高的题目优于开放度低的题目;在动词、形容词、数词、副词的词汇产出上,限制开放度的题目优于开放度较高的题目。

3.4. 词汇错误差异

所有数据均不成正态分布,故对结构开放度不同的错词、离合词错误、外文词错误、缺词、多词在总词数占比的数据进行非参数检验,非参数检验结果如下表4

Table 4. Significance graph of error difference of each word class with different structural openness

表4. 结构开放度不同的各词类错误差异显著性图

比较两组数据的差异显著性结果,我们发现,题目开放度不同的作文产出词汇在词汇错误方面,包括离合词错误、外文词错误、错词、缺词、多词几个方面均不存在显著差异(P > 0.05)。表明,题目开放度不同不影响产出词汇的准确性。

研究发现,题目结构类型差异对中高级水平汉语学习者写作产出词汇有显著影响。从产出词汇的多样性上看,题目开放度低的题目更利于产出词汇的多样性。从产出词汇的复杂性上看,产出词汇的复杂性在HSK3、HSK6、HSK7-9和超纲词上存在显著差异,在上述等级上,题目开放度低的题目比题目开放度高的题目更利于高水平词汇的产出。从产出词汇的词汇密度上看,结构开放性不同的题目,在名词、代词的产出上,开放度高的题目优于开放度低的题目;在动词、形容词、数词、副词的产出上,限制开放度的题目优于开放性较强的题目。从词汇错误来看,题目开放度不同不影响产出词汇的准确性,题目开放不同的作文产出词汇在词汇错误方面,包括错词、离合词错误、外文词错误、缺词、多词几个方面均不存在显著差异。

4. 验证性个案研究

个案分析强调研究对象的个别性,我们试图通过个案研究来验证题目结构差异所导致的词汇产出是否与从HSK作文语料库中的结果一致。

对4位高级汉语学习者进行了验证性的个案研究。选定“旅游”为主题话题,分别以不同题目结构类型和不同题目语义类型的题目进行写作训练,以观察其在不同题目类型中的词汇表现。

4.1. 研究设计

以“旅游”为主题话题,以开放度不同的题目进行写作训练,要求被试在规定的35分钟内完成一篇文章的构思与写作,写作过程中不可查阅词典和进行网上搜索。具体题目如表5

Table 5. Classification of writing training topics

表5. 写作训练题目分类表

注:词汇的多样性、复杂性、词汇密度、词汇错误的取值与计算方法与前文相同。

实验对象的基本信息:

A母语为韩语,HSK5级,学习汉语13年,专业为汉语,4年中国留学经历,职业为韩国汉语教师。

B母语为韩语,HSK5级,学习汉语15年,专业为汉语,4年中国留学经历,职业为韩国汉语教师。

C母语为韩语,HSK5级,学习汉语5年,目前正在中国留学,职业为学生。

D母语为韩语,HSK5级,学习汉语4年,目前正在中国留学,职业为学生。

4.2. 研究结果

4.2.1. 词汇多样性差异

开放度低的题目类型产出写作词汇多样性与开放度高的题目类型产出写作词汇多样性具有显著差异P < 0.01。通过多样性均值比较,开放度低的题目类型多样性均值为15.29,显著低于开放度高的题目类型多样性16.53。故,开放度低的题目类型产出写作词汇多样性高于开放度高的题目。

4.2.2. 词汇复杂性差异

对不同开放度题目产出词汇在HSK各水平的占比数据进行独立样本T检验,发现,不同开放度题目的产出词汇水平在HSK1-4上不存在显著差异(P > 0.05),在HSK5级及更高级别的词汇复杂性上存在差异。

进一步比较产出词汇在HSK各水平的占比数据均值,如表6所示

Table 6. Average ratios of each level of the two types of openness

表6. 两种开放度题目各级占比均值

表6可知,题目开放度低的题目产出高级别词汇的比例明显高于题目开放度高的题目。综上可知,题目开放度低的题目比题目开放度高的题目更利于高水平词汇的产出。

4.2.3. 词汇密度差异

题目开放度有差异的两组文本,在总的实词词汇密度上并无显著差异性。如表7所示,sig值 = 0.969 > 0.05。进一步分析发现,题目开放度不同的两组样本,除量词外,其他词性在总词数里的占比均存在显著差异。

Table 7. Word density difference of two kinds of topic openness tested by ANOVA

表7. 由ANOVA检验的两种题目开放度词汇密度差异

进一步计算各词性占总词汇比例的平均值发现,在名词、代词的产出词汇上,《的旅游》优于《一次中国的旅游》;在动词、形容词、数词、副词的词汇产出上,《一次中国的旅游》优于《的旅游》(如图3所示)。

Figure 3. Proportion accumulation diagram of parts of speech

图3. 各词性占比堆积图

在名词、代词的产出词汇上,开放度强的题目优于开放度低的题目;在动词、形容词、数词、副词的词汇产出上,限制开放度的题目优于开放性较强的题目。

4.2.4. 词汇错误差异

对结构开放度不同的错词、离合词错误、缺词、多词在总词数占比的数据进行非参数检验。通过比较两组数据的显著性结果我们发现题目开放度不同的作文产出词汇在词汇错误方面,包括错词、离合词错误、缺词、多词几个方面均不存在显著差异。题目开放度不同不影响产出词汇的准确性。

4.3. 个案研究的验证性结论

个案分析所得到的结果与前文在HSK动态作文语料库中得到的结果呈现少量区别,但基本趋向一致。

从产出词汇的多样性上看,题目开放度弱的题目更利于产出词汇的多样性。从产出词汇的复杂性上看,与语料库的群体性结果不同的是,产出词汇的复杂性在HSK5级以上的存在显著差异,而综合HSK动态作文语料库的结果表明,产出词汇的复杂性在HSK3、HSK6、HSK7-9和超纲词上存在显著差异,虽然在词汇等级上存在少量出入,但基本符合题目开放度低的题目比题目开放度高的题目更利于高水平词汇的产出的结果。从产出词汇的词汇密度上看,结构开放度不同的题目,在名词、代词的产出上,开放度高的题目优于开放度低的题目;在动词、形容词、数词、副词的产出上,开放度低的题目优于开放度高的题目。从词汇错误来看,由于受语料限制,本次收集语料未出现外文词错误,故未统计,除此,基本符合语料库中题目开放度不同不影响产出词汇的准确性结果,题目开放不同的作文产出词汇在错词、离合词错误、错误、缺词、多词几个方面均不存在显著差异。

5. 结论与启示

本文以题目结构类型为自变量,产出词汇为因变量,分析了汉语二语学习者不同题目结构类型产出词汇多样性、复杂性、词汇密度、词汇错误的差异。研究发现,题目结构类型差异对中高级水平汉语学习者写作产出词汇有显著影响。

从产出词汇的多样性上看,题目开放度低的题目更利于产出词汇的多样性。从产出词汇的复杂性上看,题目开放度低的题目比题目开放度高的题目更利于高水平词汇的产出。从产出词汇的词汇密度上看,在名词、代词的产出上,开放度高的题目优于开放度低的题目;在动词、形容词、数词、副词的产出上,限制开放度的题目优于开放性较强的题目。从词汇错误来看,题目开放度不同不影响产出词汇的准确性,题目开放不同的作文产出词汇在词汇错误方面,包括错词、离合词错误、外文词错误、缺词、多词几个方面均不存在显著差异。

题目结构开放度差异引起产出词汇差异对写作教学的启示:一、限制写作题目结构开放度,提升教学中词汇多样性训练明确度,促进非重复的词语产出,扩展写作用词范围。在汉语学习的中高级阶段,题目开放度低的题目更利于产出词汇的多样性,应优先使用开放度低的写作题目,避免使用过于开放性题目。二、提高词类训练针对性。在名词和代词的训练上,优先选用开放度高的题目。在动词、形容词、数词、副词的训练上,优先选用开放度低的题目。

基金项目

2021年山东省本科高校教学改革研究重点项目“国家级一流专业建设背景下卓越语言服务人才培养创新研究与实践”(编号:Z2021079);2021年度山东省社会科学规划研究项目“中国汉语辞书产业‘十三五’发展状况调查、分析与研究”(编号:21CYYJ05);2021鲁东大学“声速输入法”基金语言文字研究课题重点项目“《国际中文教育中文水平等级标准》初等词汇语用信息库建设”(编号:SSZD202106)。

文章引用

张丹丹,王嘉夫. 题目结构类型对汉语二语写作词汇产出的影响研究
Study on the Influence of Essay Topic Structure Types in L2 Written Vocabulary Production[J]. 现代语言学, 2023, 11(06): 2659-2668. https://doi.org/10.12677/ML.2023.116359

参考文献

  1. 1. Laufer, B. and Nation, P. (1995) Vocabulary Size & Use: Lexical Richness in L2 Written Production. Applied Linguistics, 16, 307-322. https://doi.org/10.1093/applin/16.3.307

  2. 2. Astika, G.G. (1993) Analytical Assessment of Foreign Student’s Writing. RELC Journal, 24, 61-70. https://doi.org/10.1177/003368829302400104

  3. 3. Santos, T. (1988) Professor’s Reactions to the Academic Writing of Non-Native-Speaking Students. TESOL Quarterly, 22, 69-90. https://doi.org/10.2307/3587062

  4. 4. Nation, P. (2001) Learning Vocabulary in Another Language. Cambridge University Press, Cambridge. https://doi.org/10.1017/CBO9781139524759

  5. 5. 胡明扬. 对外汉语教学中语汇教学的若干问题[J]. 语言文字应用, 1997(1): 14-19.

  6. 6. 吴继峰. 英语母语者汉语写作中的词汇丰富性发展研究[J]. 世界汉语教学, 2016, 30(1): 129-142.

  7. 7. Swain, M. (1985) Communicative Competence: Some Roles of Comprehensible Input and Comprehensible Output in its Development. In: Gass, S. and Madden, G., Eds., Input in Second Language Acquisition. Newbury House, Rowley, 235-253.

  8. 8. Read, J. (2000) Assessing Vocabulary. Cambridge University Press, Cambridge. https://doi.org/10.1017/CBO9780511732942

  9. 9. 刘华. “汉语助研”语料库建设与统计工具[EB/OL]. http://www.languagetech.cn/corpus/tools.aspx, 2020.

  10. 10. Laufer, B. (1991) The Development of Lexis in the Production of Advanced L2 Learners. The Modern Language Journal, 75, 440-448. https://doi.org/10.1111/j.1540-4781.1991.tb05380.x

  11. 11. Ure, J.N. (1971) Lexical Density and Register Differentiation. In: Perren, G.E. and Trim, J.L.M., Eds., Application of Linguistics: Selected Papers of the Second World Congress of Applied Linguistics. Cambridge University Press, Cambridge.

期刊菜单