Modern Linguistics
Vol.
12
No.
05
(
2024
), Article ID:
88566
,
7
pages
10.12677/ml.2024.125411
英语写作中词汇复杂度的动态研究
余静,胡小青
新疆大学外国语学院,新疆 乌鲁木齐
收稿日期:2024年4月12日;录用日期:2024年5月21日;发布日期:2024年5月31日

摘要
本研究基于复杂动态系统理论,借助LCA在线分析工具并通过绘制增长轨迹图、移动最小–最大图、变点分析等可视化数据分析手段,辅以问卷调查和访谈,对十名不同水平的英语专业学习者七个学期限时作文(议论文,共308篇)中词汇复杂度发展轨迹进行考察。研究结果显示:词汇密度、词汇复杂性和词汇多样性三个指标发展轨迹呈现非线性、变异性、个体差异性等特征。本研究试图对词汇复杂度做出描述性解释,以期为以后的研究提供真实的参考,并对学生写作与写作教学有一定的指导意义。
关键词
复杂动态系统理论,词汇复杂度

The Dynamic Study on Lexical Complexity in English Writing
Jing Yu, Xiaoqing Hu
College of Foreign Languages, Xinjiang University, Urumqi Xinjiang
Received: Apr. 12th, 2024; accepted: May 21st, 2024; published: May 31st, 2024

ABSTRACT
This study, based on the theory of complex dynamic systems, utilized the LCA online analysis tool along with visual data analysis techniques such as plotting growth trajectory maps, moving minimum-maximum graphs, and change-point analysis. It was also supplemented with questionnaire surveys and interviews to investigate the developmental trajectories of lexical complexity in timed essays (argumentative essays, a total of 308 essays) written by 10 English majors of different levels over seven semesters. The results of the study show that the trajectories of lexical density, lexical sophistication, and lexical diversity exhibit characteristics such as non-linearity, variability, and individual differences. This study aims to provide a descriptive explanation of lexical complexity, with the hope of offering authentic references for future research and providing some guidance for student writing and writing instruction.
Keywords:Complex Dynamic Systems Theory, Lexical Complexity

Copyright © 2024 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
1. 引言
学习者的写作产出在学习者第二语言发展中起着至关重要的作用,写作水平通常被视为学生专业知识评估的重要指标之一。对其写作中词汇的发展进行描述和探究可以为揭示语言如何发展及词汇发展背后的影响因素提供丰富的信息,以此对大学英语学习者的写作及写作教学提供参考。
2. 文献回顾
词汇复杂度被认为是语言发展和进步的有效指标。Wolfe-Quintero等(1998)指出词汇复杂度是指大量基本的和复杂的单词是可用的,并且可以被快速获取 [1] 。Read(2000)主张将词汇复杂度的测量分为四个维度:词汇密度、词汇复杂性、词汇变化度和词汇错误。词汇多样性被认为是词汇复杂性的一个通用指标 [2] 。在进行测量时,Laufer (1991)提出词汇多样性是类符与型符的比率(Type-Token Ratio, TTR) [3] ,由于TTR受文本长度的影响,因此采用Uber Index (文本中形符对数的平方除以形符对数与类符对数之差)的度量方式,其信度较好(McCarthy, 2005)。
1997年,Larsen-Freeman将复杂动态系统理论(Complex Dynamic Systems Theory, CDST)引入二语习得领域,它将语言视作一个复杂且动态的系统,包括词汇、句法等诸多子系统,每个子系统内部又包含若干子系统,各子系统之间全面关联、相互影响(Larsen-Freeman & Cameron, 2008) [4] 。她(1997)指出语言系统具有动态、复杂、非线性;混沌、不可预测、初始状态敏感;开放、自组织、反馈敏感、自适应的特点 [5] 。在CDST理论中,变异性被普遍认为是语言发展的核心要素和显著特征。
3. 研究设计
1) 语料
本研究中的语料来源于新疆大学英语专业2019级本科生七个学期完成的精读课期末考试作文。每次根据所学内容、热点话题、专四专八考题等提供统一写作话题,学生均独立完成,禁止使用字典或任何其他参考资料,以便判断参与者的真实水平。由老师现场收取作文,每学期收取一次,共收集7次。研究最终收集有效文本308篇,共计63799词。最终根据作文成绩选取研究对象共十名:A、B、C、D、E(均分前五,高水平)及F、G、H、J、K (均分倒五,低水平)。
2) 研究工具
词汇复杂性分析器(LCA, 2012)是由陆小飞教授开发的。它是一种允许语言教师和研究人员分析书面英语语言样本的词汇复杂度的工具。此外,它能够自动计算词汇密度、复杂度等25种不同的测量指标。该软件具有较高的信度和效度,并得到了相关二语写作研究的验证。按照LCA (2012)的操作流程,将短文收集整理成word文档后,进行标点错误、拼写错误、打字错误的改正。
4. 结果
由于词汇复杂度的三个指标并不是在同一尺度上测量的,为了能在一个图表中呈现不同的测量值,以便更清晰地观察到各指标间的交互作用,对原始数据进行标准化处理,并添加多项式趋势线来展示不同水平学生词汇复杂度发展轨迹。
(a) (b)
Figure 1. Trajectories of LD, LS1, and Uber Index at high-level (left) and low-level (right)
图1. 高水平(左)及低水平(右)学生的LD、LS和Uber Index的发展轨迹
如图1,高水平学生的LD呈上升趋势,而LS和Uber Index程下降趋势。这表明高水平的学生在被试期间词汇密度方面取得了进步,在词汇多样性和词汇复杂度方面有所退步。更确切地说,高水平学生的LD和LS在整个阶段波动较大,LD在写作3时降至最低,LS在写作5时降至最低,二者都在写作7时达到最高。相比之下,Uber Index波动较小,写作1时处于最低点,在写作2时跃至最高。
在低水平学生的限时写作中,LS和Uber Index的发展轨迹呈现倒U型,这表明低水平学生二语写作的词汇复杂度和词汇多样性在前四篇写作有所提高,并在后三篇写作下降。然而,低水平学生的词汇密度总体处于下降趋势。词汇密度在写作2达到最高值后,经过微弱的波动在写作7达到最低值。低水平学生的LS总体波动较大,在写作4达到最高值,并在写作6达到最低值。相比之下,低水平学生的Uber Index波动较弱,在写作1达到最低值,在写作2达到最高值。
由此,高水平学生和低水平学生二语写作中词汇复杂度三个指标的发展轨迹完全不同。高水平学生在词汇密度方面取得了进步,而低水平学生词汇密度方面先进步后退步,总体表现出退步。高水平学生词汇复杂性方面先退步再进步,而低水平学生先进步后退步。高水平学生在词汇多样性方面呈上升趋势,而低水平学生先进步后退步。
为了清晰地看出上述三个指标在不同水平学习者层面上的发展轨迹,对数据进行标准化处理。
由图2可知,不同水平学生的词汇发展轨迹并不相同,即使是处在同一水平的学生,词汇复杂度三个指标的发展轨迹也不相同。例如,在写作5中,低水平学生的F、I和J的LS呈上升趋势,而G和H呈下降趋势。此外,尽管呈上升趋势或下降趋势,但个人发展轨迹充满了不同程度的波动。这也充分体现了词汇复杂度各子系统的发展轨迹存在个体差异性。
使用相关性分析探究不同水平学习者的词汇复杂度系统内子系统的动态互动,结果显示,高水平学习者在整个发展阶段的LD和LS存在正相关关系(r = 0.985**),这表明当高水平学习者在其写作中使用更多的实词时,他们所使用的不常用词汇或高级词汇更多。低水平学习者在整个发展过程中LD与Uber Index呈负相关关系(r = −0.16**),这意味着当低水平学习者使用更多的实词时,其写作中所展示出的词汇使用范围更少。由此可见,高水平学习者词汇复杂度系统中的各项子系统存在支持关系,而低水平学习者词汇复杂度系统中的各项子系统存在竞争关系。
(a)
(b)
(c)
(d)
(e)
(f)
Figure 2. Normalized data of lexical complexity at different-level students
图2. 不同水平学生词汇复杂度三个指标发展轨迹(标准化数据)
在动态系统不断协同适应的过程中,不同水平的学生呈现不同的发展轨迹,发展变化点的结果使用变化点分析图表示。
如图3所示,高水平学生LD的可变性主要经过了三个阶段。总的来说,高水平学生在小于0.05的带宽下,词汇复杂度相对稳定地发展,直到移动窗口突然增加到0.1。因此,较大程度的可变性归因于
(a)
(b)
(c)
(d)
(e)
(f)
Figure 3. Moving min-max graph (left) and change-point analysis (right) of LD, LS and Uber Index
图3. 不同水平学生LD、LS、Uber Index的移动最小–最大值图(左)和变点分析图(右)
写作3中的明显跳跃。通过变点分析可知,变点为3,进行蒙特卡罗分析相邻两个阶段,结果显示发展跳跃具有显著性(F = 2.124, p = 0.000)。因此,从写作3开始出现了一个新的状态。低水平学生LD的可变性较为波动。在写作3到写作4,带宽激增,这表明这个期间可变性较大。经过变点分析可知,变点为4,进行蒙特卡罗分析,结果显示存在显著性差异(F = 2.117, p = 0.000),也就是说,这个阶段变化的意义是重大的。
高水平学生LS的可变性在最后一段时间出现较大波动外,在其余大部分时间都表现出相对稳定的发展。通过变点分析可知,变点为6,运用蒙特卡罗分析变点前后两个时期,结果显示相邻两个时期(F = 0.273, p = 0.000)具有显著性差异,这表明之前过程中激烈曲折的量变导致了质变,并迎来了一个新的发展阶段。低水平学生LS的可变性共经历了三个阶段。在第一阶段(写作1到写作3),带宽不断增加,这表明在这个阶段语言重组可能会发生并伴随着高可变性。变点分析可知,变点为3,蒙特卡罗分析结果显示变点前后两个时期不具有显著性差异(p = 0.653),这表明此次波动是系统偶然随机波动。从CDST的角度来看,词汇复杂度的发展停留在一个较强的“吸引子状态”,难以进入相变。这也表明了词汇复杂度的发展需要大量的高可变性来持续进步。
高水平学生和低水平学生在Uber Index的可变性发展轨迹大致相同,波动较大,每相邻两篇文章的发展趋势都不相同。高水平学生在写作2到写作3可变性增长最大,这意味着高水平学生可能在此阶段发生语言重组。低水平学生在写作4到写作5可变性急速增长,这表明低水平学生可能发生语言重组。变点分析在七篇写作中,不同水平学生均未检测到明显的变点。因此,大量的可变性还没有突破目前的状态,即在词汇多样性的发展方面未发生质的变化。
5. 讨论
本研究通过问卷调查探究影响英语专业学生英语写作中的影响因素。结果显示,相比于外部因素(m = 4.24),英语学习者二语写作时会更多考虑内部因素(m = 4.04)。由于外部因素的标准差(0.78)高于内部因素的标准差(0.60),因此,学生对外部因素的影响看法差异较大。
平均分越高,参与者的意见越积极(牛津,1995)。因此,从学习者的角度来看,写作重要性(m = 4.24)和写作态度(m = 4.14)是心理因素中最有影响力的两个因素。词汇(m = 4.64)和语法(m = 4.47)是作者知识中最有影响力的两个因素。
结合访谈发现,高、低水平学生均认为话题熟悉度、词汇和语法更能影响他们的写作。从对任课教师的访谈中也可以看出,为了让学生在限时写作中“有话可说”,他们会在课下了解同学们更关心的话题,并结合专四、专八考试要求及教学实际布置写作任务。
从学生H的访谈可以看出,词汇量匮乏会影响英语写作。她提到“会尽量把自己知道且相关的词汇用在写作中”,但对于老师上课时训练的“新词汇”记忆比较深刻,会在自己的写作中加以运用。从对任课教师的访谈中也可以看出,为了让同学们掌握新学的词汇,除了会对新词汇所在的句子详细讲解外,也会在课余时间为同学们布置相应的练习任务。从学生F的访谈中可以看出,句法知识的掌握会影响到自身的写作。她谈到“写作时基本上写的都是我最有把握的简单句”,虽尝试跟上老师对长难句的拆解及分析,但由于课下练习较少,导致对句法、句式结构等知识掌握不到位。
由此可见,高水平的学生在重视写作的同时会通过反复练习、积极提问、注重积累等方式去提高自己的写作能力。而低水平学生虽然意识到了写作的重要性,但容易局限在“正确写出词汇和句子”的意识里,没有主动去突破,而是一直被动的在“孤立记忆–不会运用–忘记”中循环。值得一提的是,结合问卷调查和访谈结果可知,高水平学生的写作目的主要集中在练习语言表达能力和兴趣,而低水平学生的写作目的主要是完成老师布置的任务和通过考试。因此,写作目的也是当前研究中需要关注的因素。
6. 结语
本研究基于动态系统理论考察大学英语学习者的词汇复杂度发展,其发展轨迹过程中存在着动态性、变异性等特征,词汇复杂度的内部指标之间存在动态交互,呈现竞争与支持的关系。这与先前的研究结果一致(郑咏滟,2015;朱慧敏 & 刘艳梅,2021) [6] [7] ,英语学习者无论是专业学习者还是大学英语学习者,其词汇发展轨迹均存在不同程度的增长、下降、动态稳定,动态发展过程中存在变异性。
本研究对学生写作和写作教学存在一定的参考意义。对于学生来说,首先需要端正写作态度,增强写作动力和学习写作技巧。由于学生的词汇发展充满了波动,因此对于教师来说,一方面教师需要为学生提供丰富的语境体验,培养学生的英语思维模式;另一方面需要培养学生的合作意识,注重多重评价,鼓励学生建立写作自信。并采用同伴互评,引导学生不仅关注词汇、句法等方面,也要关注到逻辑、思路、文章信息等方面。
基金项目
2022年自治区社科基金专项项目《新时代新疆青少年铸牢中华民族共同体意识教育创新研究》2XJJA710002。
文章引用
余 静,胡小青. 英语写作中词汇复杂度的动态研究
The Dynamic Study on Lexical Complexity in English Writing[J]. 现代语言学, 2024, 12(05): 656-662. https://doi.org/10.12677/ml.2024.125411
参考文献
- 1. Wolfe-Quintero, K., Inagaki, S. and Kim, H.Y. (1998) Second Language Development in Writing Measures of Fluency, Accuracy and Complexity. University of Hawai Press, Honolulu.
- 2. Read, J. (2000) Assessing Vocabulary. Cambridge University Press, Cambridge. https://doi.org/10.1017/CBO9780511732942
- 3. Laufer, B. (1991) The Development of Lexis in the Production of Advanced L2 Learners. The Modern Language, 75, 440-448. https://doi.org/10.1111/j.1540-4781.1991.tb05380.x
- 4. Larsen-Freeman, D. and Cameron, L. (2008) Research Methodology on Language Development from a Complex Systems Perspective. Modern Language Journal Applied Linguistics, 92, 200-213. https://doi.org/10.1111/j.1540-4781.2008.00714.x
- 5. Larsen-Freeman, D. (1997) Chaos/Complexity Science and Second Language Acquisition. Applied Linguistics, 18, 141-165. https://doi.org/10.1093/applin/18.2.141
- 6. 郑咏滟. 基于动态系统理论的自由产出词汇历时发展研究[J]. 外语教学与研究, 2015, 47(2): 276-288 321.
- 7. 朱慧敏, 刘艳梅. 二语写作词汇复杂度动态发展个案研究[J]. 山东外语教学, 2021, 42(5): 54-64.