一个使用公式化序列分类的EAL学术写作辅助环境
Posted sober-minded
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一个使用公式化序列分类的EAL学术写作辅助环境相关的知识,希望对你有一定的参考价值。
一个使用公式化序列分类的EAL学术写作辅助环境
(An assistive environment for EAL academic writing using formulaic sequences classification)
★★实验结果实验组、对照组和两维度分析:
对照组学生:使用短语库;
实验组学生:使用提出的应用程序(ARP)作为辅助工具。
一、摘要提取
研究背景:为英语作为第二语言(EAL)的新手作者写一篇英语研究文章是一项具有挑战性的任务,需要在句子和意义层面上都有经验和训练。EAL作者在撰写研究文章时采用的一个策略是使用公式化序列(FSs)。然而,可用的FS语料库是通用的,大小非常有限。目前的工作提出了一个辅助环境,通过使用特定领域的FSs来提高学术写作。FSs是从已发表的文章中提取出来的,并使用机器学习技术根据修辞类别进行分类。然后,用户可以使用建议的原型从任何研究文章中搜索并添加他/她选择的新FSs。在实际环境中对该方法的有效性进行了评价。
研究目的:设计和开发一个使用机器学习的智能辅助学术写作系统,即监督学习方法。
实验结果:结果表明,实验组学生使用ARP写作系统在提高学术写作方面有积极的影响。与使用传统短语库方法的新手作者相比,使用建议原型的新手作者报告了明显更高程度的感知有用性。
二、研究问题
(一)采用ARP写作系统方法的学生是否比采用传统语料库的学生学习表现得更好?
(二)采用ARP写作系统方法的学生在技术接受度(有用性、易用性和对学习方法的满意度)是否形成正向的反馈?
三、研究设计
为了评估辅助修辞学短语写作系统(ARP)的有效性,在真实环境中对计算机科学研究生进行了实验。与传统的学术写作方法相比,通过使用提议的应用程序来衡量写作的提高。
(一)实验对象
本研究的参与者是来自某大学信息技术学院的研究生(共58人,27名女性,31名男性)。这些学生正在攻读计算机科学硕士学位,主修人工智能(18人)、软件工程(22人)和计算机网络(18人)。入选的学生在2017年秋季学期入学,并在2018年秋季结束前完成了课程。主管分配图2。辅助修辞短语写作系统的截图。
每道题10分。学生在人工智能方面的平均成绩为20.05,软件工程20.10,计算机网络18.88。根据写作考试成绩,三个专业的学生被分为对照组和实验组。两组中得分最高和最低的学生被混在一起,以形成同质性。对照组由27名学生组成,其余31名学生被选为实验组。每个小组都由三个专业的学生组成。
表1 修辞类别
类别 |
解释 |
背景 |
一个被广泛接受的关于知识领域的陈述 |
结论 |
调查的结论;从观察和结果中推断出的陈述 |
实验 |
作者进行的实验和他们所使用的实验方法 |
目的 |
研究者要解决的问题 |
假设 |
在调查后被证明是真或假的陈述 |
方法 |
用来解决问题的方法或过程 |
模型 |
用于研究的模型类型;它取决于主题 |
动机 |
为什么研究是必要的,为什么应该进行 |
问题 |
所提出的研究旨在解决的多个问题或多个问题 |
结果 |
研究成果和讨论结果 |
(二)实验过程
辅助修辞短语写作系统(ARP)
本研究的目的是设计和开发一个使用机器学习的智能辅助学术写作系统,即监督学习方法。该系统的总体架构分为两个主要阶段:训练阶段和测试阶段。建议的系统体系结构如图1所示。
图1 系统架构
该系统将研究文章的摘要和介绍部分作为自动和手动自然语言处理(NLP)模块的输入。自动特征提取模块使用TfIdfVectorizer提取特征向量,手动特征提取模块由领域专家手动提取特征向量。将自动提取和手动提取的特征向量转发给预测模块,分别对两个特征向量生成稀疏矩阵。随机森林(RF)和支持向量机(SVM)分类器预测预测模块中每个句子的类别标签。选择准确率最高的预测模型作为最终训练模型,用于测试阶段。
TfIdfVectorizer(向量)功能:将原文档转化成tfidf矩阵
英文文档有天然的空格分隔符,但是中文没有,在使用tfidfvectorizer时,如果是中文,注意要先分词(因为tfidf的计算原理是基于词语的),如果中文不事先分词的话,tfidfvectorizer会把每个句子作为一个特征。
表2 训练模型的F-measure得分
|
自动特征提取 |
|
手动特征提取 |
||||||||
|
@100 |
|
@200 |
|
@300 |
|
@2987 |
||||
|
RF |
SVM |
|
RF |
SVM |
|
RF |
SVM |
|
RF |
SVM |
背景 |
0.65 |
0.67 |
|
0.72 |
0.67 |
|
0.70 |
0.67 |
|
0.64 |
0.58 |
结论 |
0.15 |
0.11 |
|
0.23 |
0.23 |
|
0.24 |
0.17 |
|
0.53 |
0.56 |
实验 |
0.56 |
0.46 |
|
0.48 |
0.64 |
|
0.42 |
0.59 |
|
0.32 |
0.36 |
目的 |
0.32 |
0.26 |
|
0.32 |
0.19 |
|
0.25 |
0.30 |
|
0.44 |
0.42 |
假设 |
0.14 |
0.27 |
|
0.15 |
0.50 |
|
0.29 |
0.43 |
|
0.57 |
0.50 |
方法 |
0.26 |
0.30 |
|
0.41 |
0.32 |
|
0.35 |
0.29 |
|
0.66 |
0.70 |
模型 |
0.30 |
0.48 |
|
0.29 |
0.35 |
|
0.35 |
0.26 |
|
0.75 |
0.65 |
动机 |
0.24 |
0.15 |
|
0.18 |
0.19 |
|
0.26 |
0.19 |
|
0.40 |
0.42 |
问题 |
0.72 |
0.81 |
|
0.72 |
0.80 |
|
0.69 |
0.69 |
|
0.85 |
0.90 |
结果 |
0.13 |
0.22 |
|
0.44 |
0.34 |
|
0.40 |
0.38 |
|
0.43 |
0.48 |
图2 实验过程
给出了实验过程。为了帮助学生写研究工作的介绍,在实验开始时进行了一次训练。培训课程包括以下主题:
(1)如何开始和结束介绍,使读者参与并专注于拟议的工作?
(2)信息呈现的顺序,更重要的是修辞信息的类型。
四、研究结果
(一)成绩分析
在使用ARP原型干预前进行预测,以确定研究生的基线知识,了解干预后互动学习环境在学生写作方面的改善水平。EG和CG的t检验结果见表3。实验组的总均值为29.66,标准差为2.09,对照组的总均值为29.93,标准差为2.55。采用独立样本t检验来检验两组间的显著性差异。
t检验的结果显示,前测期间的p值大于0.05。两组学生的技能水平和基线知识水平没有显著差异(t (58) =-0.445, p=0.658)。在干预前,两组拥有相同水平的写作技能的零假设被接受。
表3 前测的t检验结果
组别 |
N |
Mean |
SD |
t |
EG |
31 |
29.66 |
2.09 |
-0.445 |
CG |
27 |
29.93 |
2.55 |
|
干预结束后进行后测,所有学生在后测中都取得了满意的成绩,但实验组的成绩更高。对照组和实验组的测后计算见表4。后测分数的独立样本t检验结果显示,显著性值p < 0.05 (t(58) =14.269,p = 0.00)。这表明对照组和实验组的学术写作能力有很大的差异。零假设被拒绝,因为两组在干预后都拥有相同的写作技能水平。实验组的总均值为47.49,标准差为2.44,对照组的总均值为36.86,标准差为3.22。预测时的平均分让人很难判断谁的表现更好,但在原型干预后,实验组的分数远远高于对照组。由此可见,该原型有助于提高研究生的学术写作水平。
表4 后测的t检验结果
组别 |
N |
Mean |
SD |
t |
EG |
31 |
47.49 |
2.44 |
14.269 |
CG |
27 |
36.86 |
3.22 |
|
(二)技术接受度
在后期测试后,实验组学生被要求提供反馈,以衡量他们对所提出的写作方法的技术接受度和满意度。
在收集学生对写作系统的“有用性”和“易用性”的反馈后,发现大部分学生给予了积极的反馈。“有用性”的平均评分为4.154,而“易用性”的平均评分为4.200。感知问卷中关于“对学习方法的满意度”的反馈也是积极的,平均评分为4.064。评分显示,学生们在提高他们的写作方面感到了该系统的好处。对“写作方法满意度”维度的分析表明,ARP写作系统不仅简单,而且使用起来很有趣。
四、结论与展望
(一)结论
本文提出了一种学术写作辅助环境,并对计算机专业研究生的写作大纲和论文进行了实验研究。
该系统通过从已发表的文章中提取和分类句子,为新手作者提供了特定领域的公式化序列。结果表明,所提出的辅助环境(ARP写作系统)提高了学生的写作质量和文章结构。通过使用所提出的机器学习应用程序(ARP)的实验证明,接触多个和特定领域的公式化序列增强了EAL学生的学术写作技能。与遵循传统短语库方法的学生相比,经历了领域特定FS的学生取得了更高的分数。
(二)展望
目前工作的一个局限性是,只有科学领域的研究文章被用于训练和测试机器学习模型。社会科学研究领域有不同的公式化序列集,需要不同的特征提取集。本建议的含义不仅限于写作技能的提高;该方法可以推广到研究文章之间基于修辞句的相似度计算。
问题:研究问题不清晰,分类维度少,是因为其研究的领域(EAL学生)、所选人群和实验组使用的方法有创新性,因而论文发表到权威期刊上吗?
(个人笔记)Coursera 英语学术写作
引言
文章内容是 Academic English: Writing Specialization 课程笔记。
Conjunctions
一共有下图中3种类型的句子:1)Simple 类型的句子只有一个主语和一个动词,叫做 independent clause,这种类型的句子存在 series with 3 or more items 时,应该用逗号,比如:She bought apples, pears, and grapes 2)Compound 类型用连接词把2个 independent clause 连接起来,注意连接词前的逗号。3)Complex 类型由 independent clause and one or more dependent clauses 组成。
关于 Compound 类型的句子,又分为2种情况:1)用 conjunctions(比如:and, but, or, nor, yet, so)连接2个句子。这种情况下,连接词前面应该放上逗号。例句:The waiter brought us some water, and we looked at the menus. 2)用 transition words(比如:therefore, however, in addition, thus, furthermore, similarly, otherwise, then, nonetheless, also) 连接2个句子。这种情况下,连接词左面加分号,右面加逗号。例句:I was late to work; therefore, my boss is not happy. 这篇文章中 有更多这样的 transition words.
Adverb Clause
上面的小节中提到过,Complex 类型的句子应该有一个 independent clause 和至少一个 dependent clause. 下面2个句子是例句:
- While Sam washed his face, we listened to music.
- We listened to music while Sam washed his face.
从上面的例句中可以看出:1)adverb clause connectors + 主语 + 动词 构成了dependent clause. 2) 当 dependent clause 开头时,需要加上逗号。
一些常见的 adverb clause connectors:after, although, while, when, before, since, if, because, even if, whether or not, in case, unless, so that, even though
More Uses of Commas
当使用 introductory phrases, Interrupting phrases, and clauses 时,也应该加上逗号,下面我分别用这三种短语举个例子:
- introductory phrases: Due to the bad weather, our game was canceled.
- Interrupting phrases: The mayor, by the way, will be at the meeting.
- adjective clauses: My roommate, who hates seafood, doesn’t want me to cook shrimp.
Parallel Structure
下面是一些比常见的,需要 Parallel Structure 的 connectors:
- __ and __
- __ but __
- both __ and __
- not only __ but also __
接下来,我举几个错误的例子,然后改正它。
1、错误例句:I want to find a gym that is not only close to my apartment but also I want to find a cheap one. 第一个黑体是 adjective phrase,第二个黑体是 independent clause,因此它们的结构不一致。
改正过后:I want to find a gym that is not only close to my apartment but also affordable.
2、错误例句:He is afraid of being alone but not to die. 第一个黑体是 gerund,第二个黑体是 infinitive,因此它们的结构不一致。
改正过后:He is afraid of being alone but not dying.
Parallel Structure 和 Usage - Parallel Structure 中有更多的例子供你练习。
Sentence Variety
用多样性的句子会使你的写作看起来更加高大上。下面总结一下课程中给出的技巧:
1、用不同的 Sentence Types
2、句子开头的方式:Adverbs, prepositional phrases, and transitions. Vary sentence openings
3、在段落中混合不同的句子长度。
4、用同义词,或者用不同的表述方式阐述同一个意思
如何写 Essay
Introduction Paragraphs
一篇 essay 的 Introduction Paragraphs 通常是3 ~ 5 句话,通常用 funnels 技巧来完成它,技巧如下:
- 第1部分:General statements / Hooks
- 第2部分:More specific statements
- 第3部分:Thesis statement
写 Hooks 的手法通常用:surprising statement, anecdote, statistic, question, and quotation. Thesis statement 应该由 topic + controlling idea 组成。
Body Paragraphs
Body paragraphs 必须要支撑 introduction paragraphs 中的 thesis statement,它应该包括1个 topic sentence,2 ~ 4 个 supporting ideas, 1 ~ 3 个 details or examples. 它们之间层层递进,即 body paragraphs 中的 topic sentence 应该支撑 thesis statement,supporting ideas 应该支撑 topic sentence,而 details or examples 是更加具体的 supporting ideas. 最后,每个 body paragraphs 应该包含一个 conclusion sentence.
Conclusion Paragraphs
Conclusion paragraphs 应该保持简短,不要引入新的 ideas. 有4种方式可以写 conclusion paragraphs:
- Restate your thesis and summarize major points. 也就是用不同的句子结构总结一下 introduction paragraph 中的 thesis statement 和 body paragraphs 中的每个 topic sentence
- Predict an outcome.
- Make a suggestion.
- Call for action. 呼吁人们应该去做什么。
范文
在这个范文中,老师已经用各种颜色的字体标明了文章的结构,每种颜色的含义在文章末尾。进一步地,老师已经在 first body paragraph 加入了一些 transitions,使文章过渡地更加平滑,其余的 body paragraphs 并没有加上 transitions,供我们练习。下图是文章的部分截图,全部文章去范文下载。
Compare/contrast Essays
Compare essay 就是比较2件事情的相同点,而 contrast essay 就是比较2件事情的不同点,你的 essay 只能写这2种类型中的一种,不能混合这2种类型。Compare/contrast Essays 的 thesis statement 应该做到以下2点:
- mention the two things that you’re going to be comparing or contrasting
- indicate whether you will compare or contrast
文章结构如下图所示:
Cause/Effect Essays
Cause means what makes something happen; Effect means what happens as a result. When you write this kind of essay, you’re only going to write about the causes, or only about the effects. You’re not going to write about both in one essay.
The picture below is an outline of a cause essay:
The picture below is an outline of a effect essay:
Argument Essays
每个 argument 都有不同的方面,选择一个你认为对的方面并且给出原因,说服别人。你的论点应该是 debatable 的,否则没有任何意义。To write an argument essay, you’ll need to gather evidence and present a well-reasoned argument on a debatable issue.
参考资料
Comparison and Contrast Transition Words
以上是关于一个使用公式化序列分类的EAL学术写作辅助环境的主要内容,如果未能解决你的问题,请参考以下文章