具体学科学术词表的建立对学习者具有重大意义。Coxhead在2000年推出了Academic Word List学术词汇表(简称AWL),该词表语料来自于文、商、法及理四个学科的英文材料,同时每门学科下还有七个子学科,共计350万字符,涵盖28个学科。尽管其中包含的学术词族总体上适用于理工科,但无法充分覆盖具体学科特别是采矿工程专业的需要。采矿业作为我国经济发展的组成要素之一,其专业学术词表的建立能够满足专业学习的需求。因此本文旨在通过语料库的方法下建立采矿工程英语学术词表。该词表通过提取汇集语料库中高频出现的词汇形成的学术词表,且收录的词汇基于大规模真实语料,能够助力研究者日后的论文写作与翻译实践。 The establishment of academic word list of specific subjects is of great significance to learners. In 2000, Coxhead launched the Academic Word List (AWL for short), which is based on English materials from four disciplines: liberal arts, business, law and science. At the same time, there are seven sub-disciplines under each discipline, totaling 3.5 million characters, covering 28 disciplines. Although the academic word families included are generally applicable to science and engineering, they cannot fully cover the needs of specific disciplines, especially mining engineering. Mining industry is one of the components of China’s economic development, the establishment of its professional academic thesaurus can meet the needs of professional learning. Therefore, this paper aims to establish a mining engineering English academic lexicon based on the method of corpus. The academic word list formed by extracting and collecting frequently occurring words from the corpus, and the included words are based on large-scale real corpus, which can help researchers in future paper writing and translation practice.
具体学科学术词表的建立对学习者具有重大意义。Coxhead在2000年推出了Academic Word List学术词汇表(简称AWL),该词表语料来自于文、商、法及理四个学科的英文材料,同时每门学科下还有七个子学科,共计350万字符,涵盖28个学科。尽管其中包含的学术词族总体上适用于理工科,但无法充分覆盖具体学科特别是采矿工程专业的需要。采矿业作为我国经济发展的组成要素之一,其专业学术词表的建立能够满足专业学习的需求。因此本文旨在通过语料库的方法下建立采矿工程英语学术词表。该词表通过提取汇集语料库中高频出现的词汇形成的学术词表,且收录的词汇基于大规模真实语料,能够助力研究者日后的论文写作与翻译实践。
学术英语词表,词频,语料库应用
Yiwen Wang
China University of Mining and Technology (Beijing), Beijing
Received: Mar. 6th, 2022; accepted: Apr. 5th, 2022; published: Apr. 13th, 2022
The establishment of academic word list of specific subjects is of great significance to learners. In 2000, Coxhead launched the Academic Word List (AWL for short), which is based on English materials from four disciplines: liberal arts, business, law and science. At the same time, there are seven sub-disciplines under each discipline, totaling 3.5 million characters, covering 28 disciplines. Although the academic word families included are generally applicable to science and engineering, they cannot fully cover the needs of specific disciplines, especially mining engineering. Mining industry is one of the components of China’s economic development, the establishment of its professional academic thesaurus can meet the needs of professional learning. Therefore, this paper aims to establish a mining engineering English academic lexicon based on the method of corpus. The academic word list formed by extracting and collecting frequently occurring words from the corpus, and the included words are based on large-scale real corpus, which can help researchers in future paper writing and translation practice.
Keywords:Academic English Word List, Word Frequency, Corpus Application
Copyright © 2022 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
科学研究和学术交流的国际化趋势对专业人员,尤其是大学生的学术交际能力提出了较高要求。黄宽宏(2020) [
学术词表是对学术文本中除高频使用的实义词和功能词以外使用频率较高的词汇汇总成表。目前,对于各专业的学术词表建设已取得显著进展,如Academic Word List学术词汇表AWL (Coxhead 2000) [
与此同时,何玲(2016) [
尽管在国内已建立许多具有专业用途的学术词表,但有关采矿专业英语学术词表领域研究较少。目前,还存在着语料库库容较小,语料来源主要从教材,英文原著,书籍和期刊论文等,缺乏针对性和代表性。语料的年份较为久远,无法满足当下的需求。矿业作为国民经济增长的产业之一,具有十分重要的地位。因此,本研究旨在创建采矿学术词表,为该学科的翻译及学术英语教学提供借鉴。
语料的采集对于建设语料库有着至关重要的作用,其选择的语料来源要具有针对性,代表性以及时效性(丁自华,2011) [
每篇论文的文本整理本着遵循原文这一主要原则,重点整理语料中的图表公式、多余空格、换行符及其他不标准符号等,形成UTF-8编码格式的txt文本,并进行人工校对逐一核查。
本文采用语料库分析软件AntConc对语料进行统计分析。AntConc是语料库检索工具,适用于语言学、翻译学、外语教学等领域的研究者。将采矿工程专业学术英语语料库导入Antconc后,采用Crown corpus (2009)作为对比语料库,并相应导入英语停用词表与lemmatization (词性还原)作为参照,所有带有不同形式的词汇都将还原成基础词性,词性的统计都以原形为单位。
Antconc统计出语料库中出现频次较高的词汇,形成了初步的词表。在手动删除了其中留有的介词、代词等功能词后,选取其中频次大于等于50的实词收录入采矿工程学术英语词表,词表内共收录了2070词。
在开发词表时,首先对词汇进行了词性还原,这样能减少学习者的负担,有利于词汇的学习与记忆(Lei & Liu, 2016) [
序号 | 频次 | 词元 |
---|---|---|
1 | 9501 | rock |
3 | 6256 | fracture |
7 | 4139 | specimen |
10 | 3736 | coal |
11 | 3647 | process |
12 | 3565 | sample |
13 | 3409 | mineral |
14 | 3376 | test |
15 | 3329 | strain |
17 | 3017 | deposit |
18 | 2958 | mine |
19 | 2935 | ore |
20 | 2901 | surface |
21 | 2753 | joint |
25 | 2607 | energy |
27 | 2535 | strength |
28 | 2527 | temperature |
33 | 2345 | parameter |
34 | 2335 | datum |
35 | 2247 | material |
表1. 采矿工程专业部分高频实词
在观察词表中收录的词所在的索引行时发现,词汇在文中的时态具有规律性。辛闻,王会娟(2016) [
采矿工程学术英语词汇专业性极强,收录的词汇大多由普通名词或半专业词汇转化形成的,在日常生活中很少使用且词义的内涵也比较广泛。部分词汇应用于采矿专业时,会出现与其普通用法截然不同的含义。如何正确精准的识别与应用这些词汇对于学习者十分重要。例如“burden”原意为“负担,责任”,但在采矿英语中的意思为“抵抗线”。“fault”在普通用法下是“错误”,但在采矿英语中可以翻译为“断层”。
该词表中收录的词汇可与其他词汇组成固定搭配,构成采矿工程专业的专有名词,辅助学习者掌握记忆专业词汇。如strain原意为“压力,应变”(频次3329)在ME3_RA_128中有Both the matrix strain and the bulk strain also increase accordingly。该词组合形成matrix strain (基体应变)和bulk strain (体应变)。还有deposit原意为“放置,定金”,在ME_RV_07中提到“The ore deposit is hosted within the Taft and A bkuh formations.”(矿床产于塔夫脱和A-bkuh岩层中。)中deposit与单词ore组合后形成的固定搭配ore deposit应该翻译为矿床。像这样的固定搭配还有很多,如energy spectrum (能谱),flow parameters (气流参数),fluid displacement (流体驱替),shear cracks (剪切裂隙)等等。
同时,固定搭配形成的专有名词在文中的出现频次在一定程度上可以反映出该领域是最近学术界的研究热点。据统计,rock damage“岩石损伤”一词共出现66次。学界对其的讨论主要围绕着1) 假设其是研究中影响结果的变量之一进行讨论。如“For blasting excavation of rock slopes, the size of the EDZ and the degree of rock damage are influenced by a large number of factors in addition to excavation methods and in-situ stress.”(对于岩质边坡的爆破开挖,除开挖方法和地应力外,还受多种因素的影响,如爆破带的大小和岩石损伤程度。) 2) 强调岩石损伤的研究对于其他研究具有重大意义。原文中提到“Furthermore, much attention has been paid to the law of rock damage accumulation which is helpful for evaluation of fatigue life and establishment of damage model under cyclic loading conditions.”(此外,对岩石损伤累积规律的研究有助于疲劳寿命评估和循环加载损伤模型的建立。)
原文1:W represents the hydraulic aperture, which is calculated based on the stretch of the bond.
原文2:The hydraulic response of the COx is strongly influenced by stresses and temperature.
译文1:W为水力孔径,根据粘结的拉伸程度计算。
译文2:COx的液压响应受到应力和温度的强烈影响。
同为hydraulic一词,在不同语境下的意思分别为形容词“水力的”和名词“液压”。同样,还有:
原文3:In top-blown copper smelting furnaces such as the TSL furnace, a single lance is installed from the top of the furnace, extending below the melt surface.
原文4:It is likely that there will be progress in mitigating the effects of surface alteration.
译文3:在顶部吹制的铜熔炼炉中,如TSL炉,从炉顶安装一个喷枪,延伸到熔体表面以下。
译文4:在减轻地表变化的影响方面很可能会取得进展。
Surface在原文3中的意思是“表面”,而在原文4中则为“地表上的”。这要求学习者需要灵活掌握词汇的多种意思的同时,还要在阅读中仔细研读上下文,准确把握词汇的正确意思。
目前,有关通用词表与学术词表的建立已形成了一定的规模,同时许多具体学科也建成了专业英语词表。然而目前有关采矿专业学术词表方面仍存在空白。该学术词表的建立能够补充我国在专用语料库上的不足,助力研究者日后的论文写作与翻译实践。矿业作为我国国民经济增长的产业之一,矿业为基础的原材料加工业以及相关产业占全国工业生产总产值约60%以上。在国际之间商业贸易与科技交流日益增长的趋势下,我国作为矿业大国需要频繁的使用英语与他国进行对话沟通。专业学习者需要不间断的了解学习国际上新出现的矿业知识,或者在国际期刊上发表相关领域的个人研究并与国外同行进行学术交流。
综上所述,本文基于采矿专业英语语料库,建立了采矿工程学术词表。该词表通过提取汇集语料库中高频出现的词汇形成的学术词表,能够帮助学习者提高综合语言水平。其中收录的词汇基于大规模真实语料,适用性高。其中的应用包括教师及教材编写者可以根据词表中的高频词汇,结合实际情况进行有针对性的教学活动与教材编写,应用于学术英语课堂核心高频词的教学工作以及翻译教学中。与此同时,学习者可以结合自身需求学习采矿专业英语学术词表,以便日后期刊论文的阅读及写作,提高用词的准确性。但仍存在后续语料库的更新后词表需要更新迭代的问题,词表中的高频词汇收录年份为2018年~2020年,随着学界热点研究话题的变化,词表中收录的词汇也需更新。因此在之后的研究中,在完善语料库实时性的同时,应兼顾学术词表的发展。
中国矿业大学(北京)大学生创新训练项目资助与“中央高校基本科研业务费专项资金资助”,项目编号:202108009。
王奕雯. 采矿工程专业学术英语词表的创建Establishment of Academic English Vocabulary for Mining Engineering[J]. 教育进展, 2022, 12(04): 955-959. https://doi.org/10.12677/AE.2022.124151