基于文本挖掘的学习分析应用研究
Posted 电化教育研究
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于文本挖掘的学习分析应用研究相关的知识,希望对你有一定的参考价值。
华中师范大学 刘三女牙
近年来,“大数据”成为了各行各业关注的热点话题,教育作为大数据的一个重要应用领域,相关学者已预测大数据将给教育带来革命性的变化。开放式网络课程的井喷式涌现和在线学习平台的普及,使教育领域中的“大数据”技术获得了更为广阔的发展空间,为利用这些数据中隐含的、有价值的信息,进行智能化的教学决策与学习服务的优化,学习分析技术应运而生。当前国外一些学习分析研究小组和机构已开展了一些前瞻性项目和应用,例如:2009年美国普渡大学推出一个名为信号(Signals)的项目[7]。它旨在利用课程管理系统中的数据来预测学业成功与失败;2011年比尔和梅琳达·盖茨基金会资助开发的大数据分析系统——“学位罗盘”(Degree Compass)[15]。它能在对学生信息管理系统中数据分析的基础上向学习者推荐合适的课程;2012年密歇根大学开发了用于鼓励和指引学习者有效完成交互活动的Gradecraft平台等[16]。我们可发现,目前的学习分析应用大多是利用学习管理系统、教学软件来收集学习者个体及群体在网络教学活动中产生的结构化数据,然后从中提取知识并存入关系型数据库。
然而最近的趋势是交互科技(Interactive Technologies)在教学中得到了广泛应用,通过在线学习系统、社交网络平台、移动终端生成了越来越多复杂的非结构化数据。非结构化数据包括所有格式的办公文档、即时信息、e-Mail、声音、图像和音频等等。Gartner和IDC称:近80%的网络数据都是非结构化[1][2][22],这些数据蕴藏了大量有价值的信息,但是目前人们还很难管理和分析。非结构化数据是不符合预定义的数据模型的内容,难以实现自动化识别,并且不完全符合数据库的存储标准与规范。毫无疑问,文本是非结构化数据中最典型、显性的实例来源[2][20]。通过捕获和分析在商业、生物医学、政府等中的文本数据[2][17][19][23][25]已改变了其决策的制定和资源的分配。然而,在教育领域中,致力于优化学习服务的学习分析技术,通常注重于数字的分析[3],比如在线学习系统中学习者的登录/登出次数,上传/下载文件次数,提交/未提交作业次数,浏览课件时长等外显式行为数据,但较少考虑学习者的态度与感受等内隐式行为信息,例如学习者群体的在线对话交流与讨论,学习者个体的课程评价、笔记等数据信息。因此传统的学习分析技术难以准确发现学习者的个体意愿和内在心理状态,并不能深入解释影响学习者学业成功与否的关键因素。文本作为教育大数据中一种特质的类型,最真实、直接地反映了学习者的学习动机、认知发展、情感态度、学习体验。通过文本挖掘,可提取出学习者文本表达中隐藏的关键信息,实时监控学习者的意见和想法,将有助于学习者在文本交互中的自动干预和推理。并且至2011年起,连续四届“学习分析技术与知识国际会议”中,文本作为协作学习和知识传播的重要途径成为了一个研究重点。由此可见,文本挖掘在学习分析中的地位已日益凸显,那么如何将文本挖掘的优势与学习分析应用相结合就给我们带来了新的研究视角和挑战。
(一)大数据环境下的学习分析
随着教育信息化的不断深入和“大数据”时代的来临,学习分析作为大数据在教育中的重要应用之一,为达到支持教学决策,优化学习服务的目的提供了一系列方法和策略。加拿大阿塞巴斯卡大学的G.Siemens 教授[5]认为学习分析是“关于学习者以及他们的学习环境的数据测量、收集、分析和汇总呈现,目的是理解和优化学习以及学习情境”。新媒体联盟(NMC)将学习分析定义为:利用松散耦合的数据收集工具和分析技术,研究分析学习者学习参与、学习过程和学习表现的相关数据,进而对课程、教学和评价进行实时修正[4]。并且新媒体联盟地平线报告(2014高等教育版)中[16]预测学习分析将在1年内成为主流。
(二)面向学习者行为的文本挖掘
文本挖掘作为辅助学习分析的核心技术之一,可以帮助辨识和解释学习者的心理及行为过程。文本挖掘作为一种主流的方法论,在许多领域都有广泛的应用。文本挖掘一般指从非结构化的文本数据中(例如:文档、聊天信息和邮件)发现和提取有用的模式、模型、方向、趋势或者规则[43][44],最终形成用户可理解的信息与知识的过程。它是语言学、统计学、机器学习、数据挖掘及自动文本处理如信息抽取、信息检索、文本分类等理论和技术相结合的产物,更多地被用在生命科学研究、政府智能、商业等应用领域。目前,已有不少研究将文本挖掘引入教育领域中,辅助文本内容研究,实现面向学习者行为的文本数据挖掘,支持学习设计和评估反馈。
在查阅国内外著名文献资料数据库基础上,本文尝试运用文献分析法对基于文本挖掘的学习分析应用研究的现状进行综述和梳理,具体情况如下:
对于国内研究,文献分析的主要来源是“中国知网”学术文献库中的相关文献。笔者在“中国知网”学术文献库中以最近十年(2005年1月至2014年12月)为时间跨度,对“文本挖掘”和“在线学习”、“文本分析”和“在线学习”、“学习分析”等关键词进行高级搜索,统计时剔除与主题关联性不大的文章,最后获得相关文献11篇。由此可见国内运用文本挖掘技术来调整和改善教学的研究较少,缺乏具体的案例实践经验,有待进一步思考和研究。
对于国外研究,笔者借助Google学术搜索、ACM 美国计算机学会数据库(国际站)、Elsevier Science Direct Online数据库为国外文献搜索来源,以最近十年(2005年1月至2014年12月)为时间跨度,对“文本挖掘(Text Ming)” 和“在线学习(Online Learning)”、“文本分析(Text Analysis)” 和“在线学习(Online Learning)”、“学习分析(Learning Analytics)”等关键词进行高级搜索,对搜索结果进行针对性的选读并去掉重复篇章,最后获得与本文主题相关学术期刊或会议论文共103篇(Google学术搜索43篇,ACM数据库31篇,Elsevier数据库29篇)。如图1所示是国内外各年份研究论文的数量分布。
图1显示,国内外对文本挖掘学习分析应用的研究整体有显著的上升趋势。尤其自2010年以后,研究论文增长的幅度更为明显,主要因为在国际上有专门针对学习分析研究和应用而召开的国际会议“学习分析技术与知识国际会议”和美国新媒体联盟与美国高等教育信息化协会(EDUCAUSE)对学习分析研究的高度重视,并且越来越多的研究者对利用文本挖掘技术助力学习者知识能力的测评和学习者心理与行为的研究方法产生了较大的关注度和兴趣。根据文本挖掘在学习分析应用中的研究与实践,我们可以将获取的114篇文章划分到七个应用类别:“课程评价支持”、“学习者知识能力测评”、“学习共同体分组”、“学习行为危机预警”、“学习效果预测”、“学习状态可视化”、“其他”(包括知识构建、文本注释、同伴互评等方面研究)。图2所示是文本挖掘在学习分析中的具体应用研究分布情况。
从图2可看出,往年关于课程评价支持的研究相对较多,一定程度上反映出文本挖掘在支持课程教学方面具有较强的实用意义和价值。最近几年,各类具体应用研究的比重都有所提高,这也表明将文本挖掘作为一种技术手段来调整和优化教学过程已日渐得到本领域研究者的肯定和认可。
为了更全面准确地揭示学习系统的概览,学习分析中不仅应包括结构化数据,也应包括以文本为主的非结构化数据。我们需充分利用文本挖掘技术的优势来剖析学习者文本表述背后的深层次含义和理解其认知过程,辅助分析、优化学习及其发生情境。如图3所示是文本挖掘应用于学习分析的系统框架图,左侧列举了制约文本挖掘在教学中继续深入推进的关键因素,中间描述了文本挖掘作为支撑学习服务的一种辅助技术的过程, 右侧总结了文本挖掘应用于学习分析中的一些具体实践项目。
(一)数据来源
目前,在线学习系统、教学网站和网络公开平台的讨论区、实时答疑室、评论模块、学习文档、学习笔记和日志已成为学习者产生文本数据的主要来源,并且随着广播式社交网络应用的盛行,校园SNS (Social Networking Services)、微博、博客等Web应用以及移动手机、平板上所产生的文本数据都为密切跟踪学生学习的感受和需求提供了充足且真实的数据源。与现实中面对面交流不同,虚拟网络为学习者提供了更为自由和开放的言论空间,这使得学习者在在线互动过程中“无意”生成的数据里蕴含大量潜在的、有价值的个体或群体信息。
(二)分析方法
根据文本挖掘的主体可分为人工挖掘和自动挖掘。人工挖掘是人们阅读文档、关注内容并手动划分其类别,虽然对于小样本文本数据的分析,人们很擅长理解其含义,但耗时又耗力,并且对于当前日益增长的文本数据而言,仅使用人工挖掘显得不太现实。而自动挖掘不仅可以节省时间和人力成本,并且适用于解决海量文本数据分析的问题。通过对收集文献的总结归纳,基于自动挖掘的方法可以涵盖以下几种:(1)分类;(2)聚类;(3)关联规则分析;(4)语义分析;(5)可视化;(6)话语分析;(7)内容分析;(8)其他。如图4所示是文本挖掘应用于学习分析具体案例中各种方法数量的柱状图。(一篇文献可能包括一种或多种分析方法,本文采用累加统计。)
从图4可看出,分类、聚类、关联规则分析等经典文本挖掘方法仍占据很大比例,不过作为社会科学领域中的关键方法话语分析和内容分析也表现出强劲的增长趋势。
(三)分析工具
针对不同学习情境中文本数据的复杂性、内隐性、交互性等特点,一些特色各异的文本挖掘工具已经被设计和开发,极大加快了人们从中提取信息的能力,为快速、精准、深入解读学习者表述中的隐含内容和丰富意义提供了便利。如表5所示是基于文献分析基础之上,对学习分析具体实例中文本挖掘工具的使用次数进行排序和概述。
当前文本挖掘与学习分析正在不断地深度融合,这一交叉领域已产生了大量研究成果,具有广泛的应用前景。根据差异化的教学目的,针对不同的学习情境,研究者开发出一些新工具和提出新模型、方法,并在新研发平台或已有平台上开展了大量实例研究。笔者对其进行详细的总结和归纳,主要从以下六个方面来探讨。
(一)课程评价支持
作为一种有效的教学方法,课程评价在教学过程中的作用至关重要,能为教师和学生提供及时的反馈和建议。如一项探讨挖掘学习者反馈的教学文本情感研究[41],提到在每门课程结束后,学习者通过移动设备发送短消息来评价课程教学。该研究旨在利用SMS(Short Message Service)文本内容和表情符号来呈现课程评价的积极和消极内容。与此类似的一项研究中,Kontogiannis等人提出了一种新的课程教学评价框架来自动挖掘学习者情感观点[26],他们通过收集学习者在社交网络微博客中产生的有关学习课程活动文本数据,并利用观点挖掘技术来判断学习者对每门课程所持有的积极或消极态度。此外,一项由美国国家科学基金会资助的学习系统GIS研究[30],通过收集GIS系统中大学生的文本评论内容,使用文本挖掘技术来发现和抽取潜在的知识,旨在将学习者评论划分为不同类别,从而辅助学习平台的教学者可以从大量文本数据中快速识别出关键主题,为进一步指导课程教学提供依据。
(二)学习者知识能力测评
相比传统研究中利用学习者的客观题解答结果来评估知识掌握程度,我们可以利用学习者在教学活动中产生的主观文本数据来测评其知识结构、高级思维技能等。以下我们将主要从学习者写作能力和阅读理解能力测评两个方面来阐述。在威特沃特斯兰德大学计算机科学学院[36],研究者专注于开发一个自动短文评分系统,它通过对学习者提交的短文本内容采用潜在语义分析方法进行自动评分。实验结果指出该系统在理想的配置下可以准确测评出学习者的写作水平,并且自动评分的准确度可超过80%。此外,中国香港大学计算机科学与工程系研究者开发了一个名为VeriGuide的平台[34],旨在提供专业的写作工具集测评学习者能力并促进写作的教学和学习。在智利大学,一项基于情境化模型和潜在语义特征的自动化文本理解分类器研究中[13],以来自工程学和语言学学院的大一学生为实验对象,通过分析学习者关于阅读资料问题的文本作答来检测发现其阅读理解能力的不足。此外,就学习者的阅读理解任务而言[14],该项研究描述了如何结合多维K-means聚类方法和布鲁姆教育分类理论来确定他们采取的积极和消极的认知策略。
(三)学习共同体分组
大规模在线学习环境中,协同学习已经成为一种主流的学习方式,我们应结合实际的教学需要,根据学习者特征来确定不同类型的学习者,促进学习共同体学习效果的最优化。例如,在加拿大英属哥伦比亚大学,一项辨识学习者在线交互行为模式的研究中[35]。研究者基于学习者与在线学习平台的交互日志进行分析,构建用户模型框架,对具有相同学习偏好、兴趣、主题等的学习者进行聚类和分组,提供合适的学习支持和交互体验。在此基础之上,西班牙科尔多瓦大学计算机科学学院研究者提出了一种改进的聚类模型[6],相比传统收集学习者所有在线交互的日志数据,该模型在划分学习共同体组别方面具备更好的适应性。在美国哥伦比亚大学计算学习系统中心,研究者介绍了一种非监督式方法来自动化检测讨论区主题内持有相似观点的学习者[46]。实验结果指出学习者含蓄态度的表达(倾向于使用相似的文本内容)对于直接态度的表达(讨论话题内隐含的情感)是一个很重要的补充,并且两者的结合可以有效提高构建学习共同体的准确度。
(四)学习行为危机预警
根据言语行为理论[29],人们在书写文字的同时也在实施某种行为,从文字中传递出来的言语信息可反映个体的意志和行为心理现象,能为教师及时掌握学习者的思想状况及行为危机预警提供可靠的决策支持。在澳大利亚昆士兰大学,研究者使用SNAPP(Social Networks Adapting Pedagogical Practice)工具来分析学习者与讨论区的交互活动[11],旨在识别处于高风险状态的学习者,引导教学者及时实施干预。由美国国家科学基金会(National Science Foundation)资助卡耐基梅隆大学计算机科学学院的一项关于情感分析来预测学习者退课行为的研究中[39],以Coursera平台中3门课程的讨论区帖为数据来源,通过分析学习者集体的情感来监测学习者在课程中的情感趋势。实验结果指出学习者在课程讨论区内的集体情感比率与其退课率有显著的关联。此外,在美国德州大学达拉斯分校行为与脑科学研究院,Underwood教授开展的关于中学生反社会行为挖掘的开创性研究[27][28]。该研究通过采集学习者在手机通讯中产生的短信内容,利用发布时间、关键不良情绪词、发送对象等信息推测群体性不良行为,并得出了触发该群体不良行为的一系列量化因素,为学习者行为的分析和危机干预起到了重要的推动作用。
(五)学习效果预测
研究者通过采集和分析学习者学习经历相关文本数据,探索学习者在不同阶段中学习效果的改变,发现学习者学习行为与学习效果的相关关系。例如,在美国德克萨斯大学[8],研究者以363个大学生的自我介绍简文为数据来源,使用LIWC工具对其进行分析来预测学习者的课程效果。实验结果指出某些特殊语词类别的词语构造使用概况确实可作为预测学习者课程效果的重要指标。西班牙科尔多瓦大学计算机科学与数据分析学院提出了从定量、定性和社交网络三个测量角度来评判学习者在讨论区内的参与行为[9],并结合不同的文本挖掘方法来提高学习者最终学习效果预测的准确度。实验结果表明,基于学习者在讨论区内产生的文本数据,使用聚类及关联规则分析方法有助于预测学习者课程通过情况。此外,韩国梨花女子大学研究者通过分析学习者的学习日志[12],从中选取能够体现其时间管理策略的3个变量来验证与学习者学习成效的关联关系。
(六)学习状态可视化
使用文本数据的交互式图形来评价学习者的知识结构、认知能力、情感态度等多维度的状态特征,有助于教学者的教学决策和学习者的自我学习监控。例如,英国开放大学研究者提出了一个自然语言处理工具XIP[37],旨在分析学习者的学术写作文档,并通过仪表盘来可视化其中的关键特性,如语句的修辞类型、关键概念等。在台湾一项分析学习者知识构建过程的研究中[33],以56个来自信息管理专业的研究生为实验对象,通过分析处理学习者在在线学习社区交互过程中产生的文本内容,按照布鲁姆的教育目标分类法,从知识层次、领会层次、应用层次、分析层次、综合层次和评价层次6个方面为教学者和学习者呈现实时可视化的认知能力评估图形。研究结果指出该评估方法可通过有效激发学习者的学习动机来发布高阶认知层次的内容,并促进学习者之间更深层次的对话交流。在一项旨在追踪学习者情绪变化过程的研究中[32],教学者通过自主开发平台来分析学习者的学习体验日记,依据普拉特切克的情绪三维理论,自动抽取学习者的8类基本情绪,实现学习者情绪流的动态可视化呈现。
除了以上描述的六个主要应用研究方面外,也有部分考察和促进学习者高阶思维能力发展的研究。比如,Gasevic等人通过使用特有的文本挖掘框架LIWC[42][47],收集学习者产生的文本数据来分析他们的心理和语言加工过程,识别和抽取其中的关键变量,从而培养自我反思和元认知建构的技能;此外,Rosen等人采用语义模型来实现文本挖掘研究的结果表明[10][48],学习者的分析推理和探索分析能力都有所提高,学习者之间的协作明显加强。最近研究发现,研究者相当重视一定社会文化情境下学习者与在线对话交流实践中的文本话语,相比学习者外显行为数据,这些数据更能表征出学习者在特定情境中的内隐思维过程。并且运用话语分析技术,可以帮助我们理解不同类型文本消息或消息序列在知识构建过程中存在的时间和因果关系,而且有助于我们探究意义学习的发生模式[21][24][40][45]。建构主义作为认知学习理论中一个重要分支,对话语分析的研究提供了有力的理论支撑。建构主义学者认为学习是在一定的社会文化情境中,学习者主动地建构个人知识与经验的过程。他们强调知识的构建性,关注学习发生的本质和规律,而不仅仅是简单的表征和描述,这就与研究者分析话语的核心思想不谋而合。
众所周知,一场由网络教育2.0为标志的新革命正强烈冲击着传统教育的生态环境,学习的交互方式和组织形式不断被重塑和变革,个性化学习需求受到各界重视,以学习者为中心的新的教学模式催生了大量文本数据的产生,如何利用文本挖掘技术对其进行深度挖掘,提取潜在的、有价值的规律信息及群体或个体学习行为模式已经刻不容缓。将文本挖掘应用于学习分析中,不仅可以帮助学习者快速定位和检索关键信息,也能够引导学习者进行自我反思、自我管理、自主学习,促进学习者的知识构建和有意义学习。
然而,由于技术与现代化教育理念的融合尚浅、文本挖掘技术的发展瓶颈、研究者单一学科背景的局限等多方面的不足,目前采用文本挖掘的学习分析研究仍处于初级阶段。未来相关研究可以从以下几个方面深入展开:
1. 多样性文本数据的标准研究。随着泛在学习环境的不断丰富,面对学习过程中产生的大量不同来源的文本数据,如何规范化管理和共享,实现数据的兼容性和统一性是当前急需解决的问题。
2. 面向学习服务的文本挖掘模型和方法研究。文本挖掘作为一种面向学习服务的社会情境性辅助技术,所涉及的多种模型和方法大多局限于某一学科或情境,为避免资源的浪费,应设计一些通用的文本挖掘模型和方法来实现跨平台、跨学科的应用。
3. 学习者在线交互文本数据的深度学习技术研究。深度学习技术有利于探讨对学习本质的认识,应加大研究力度和资助经费来挖掘交互式文本数据中的各种学习行为和心理信息,通过深入分析和掌握学习者文本表达的内在含义、理解学习者在协作学习中知识信息的建构过程,实现知识驱动的深度学习研究,探讨意义学习的演化规律以及进而揭示其发生机制。
4. 跨领域的多学科交叉理论研究。目前此项研究主要是从自然科学领域的角度出发,如机器学习、自然语言处理、统计学等,难以挖掘文本数据中隐藏的深层次内涵和解释学习者的心理状态变化,应融合人文科学领域视角,如学习科学、学习心理学、教育学等,进一步为其提供理论依据。
笔者相信,为了更好地理解和优化学习以及学习情境,文本挖掘将成为学习分析研究中一种有力的论证方法。我国广大教育工作者有必要充分意识到文本挖掘在学习分析应用中所扮演的重要角色,借鉴国外先进的理念和研究经验,将此项新型的研究运用于在线学习中,支撑数据驱动的学习和评估,更准确客观地认识学习者,帮助其获得更高的学业成就,优化教学方法和教学活动,从而进一步推动教育教学的创新研究。
发表于《电化教育研究》2016年第2期
[参考文献]
[1] Steve Kearns. Six Reasons Businesses Need to Pay Attention to Unstructured Data[EB/OL]. http://www.itbusinessedge.com/slideshows/six-reasons-businesses-need-to-pay-attention-to-unstructured-data-05.html,2013-12-01.
[2] White Paper. Unstructured Data Analytics: Unlock the Treasures of Your Unstructured Content [DB/OL].https://www.filelytics.com/sites/default/files/downloadable/.
[3] 吴永和,曹盼,那万里,马晓玲.学习分析技术的发展和挑战——第四届学习分析与知识国际会议评析[J]. 开放教育研究,2014,20(6):72-80.
[4] The New Media Consortium. NMC Horizon Report 2011 Higher Ed Edition [EB/OL]. http://www.nmc.org/publications/horizon-report-2011-higher-ed-edition, 2011-01-10.
[5] 魏雪峰,宋灵青.学习分析:更好地理解学生个性化学习过程[J].中国电化教育,2013,(9):1-4.
[6] Bogarín, A. ,Romero, C. , Cerezo, R. , & Sánchez – Santillán, M. .Clustering for improving educational process mining[A]. In Proceedings of the Fourth International Conference on Learning Analytics And Knowledge[C]. New York: ACM Press, 2014: 11-15.
[7] 祝智庭,沈德梅.学习分析学:智慧教育的科学力量[J].电化教育研究,2013,(5):5-12.
[8] Robinson R L, Navea R, Ickes W. Predicting Final Course Performance From Students’ Written Self-Introductions: A LIWC Analysis[J]. Journal of Language and Social Psychology, 2013: 1-11.
[9] Romero C, López M I, Luna J M, et al. Predicting students' final performance from participation in on-line discussion forums[J]. Computers & Education, 2013, 68: 458-472.
[10] Rosen D, Miagkikh V, Suthers D. Social and semantic network analysis of chat logs[A]. Proceedings of the 1st International Conference on Learning Analytics and Knowledge[C]. New York: ACM Press, 2011: 134-139.
[11] Bakharia A, Heathcote E, Dawson S. Social networks adapting pedagogical practice: SNAPP[J]. Same Places, Different Spaces, 2009: 49-51.
[12] Jo I H, Kim D, Yoon M. Analyzing the log patterns of adult learners in LMS using learning analytics[A]. Proceedins of the Fourth International Conference on Learning Analytics And Knowledge[C]. New York: ACM Press, 2014: 183-187.
[13] Bravo-Marquez F, L'Huillier G, Moya P, et al. An automatic text comprehension classifier based on mental models and latent semantic features[A]. Proceedings of the 11th International Conference on Knowledge Management and Knowledge Technologies[C]. New York: ACM Press, 2011: 158-162.
[14] Peckham T, McCalla G. Mining Student Behavior Patterns in Reading Comprehension Tasks[J]. International Educational Data Mining Society, 2012, 34: 87-94.
[15] West, Darrell M. Big Data for Education: Data Mining, Data Analytics, and Web Dashboards. Governance Studies at Brookings [R].Washington: Brookings Institution, 2012: 1-10.
[16] The New Media Consortium.NMC Horizon Report 2014 Higher Ed Edition [EB/OL]. http://www.nmc.org/publications/horizon-report-2014-higher-ed-edition, 2014-01-10.
[17] Di Mo, Renfu Luo, Chengfang Liu, Huiping Zhang, Linxiu Zhang, Alexis Medina, Scott Rozelle. Text Messaging and its Impacts on the Health and Education of the Poor: Evidence from a Field Experiment in Rural China[J]. World Development, 2014, 64(1): 766-780.
[18] Reategui E, Epstein D, Lorenzatti A,et al. Sobek: a text mining tool for educational applications[A]. Proceedings International Conference on Data Mining (DMIN)[C]. Las Vegas: ACM Press, 2011: 59-64.
[19] Byrd R J, Steinhubl S R, Sun J, et al. Automatic identification of heart failure diagnostic criteria, using text analysis of clinical notes from electronic health records[J]. International journal of medical informatics, 2014, 83(12): 983-992.
[20] Seth Grimes. Unstructured Data and the 80 Percent Rule [EB/OL]. http://breakthroughanalysis.com/2008/08/01/unstructured-data-and-the-80-percent-rule/.2008-08-01.
[21] De Liddo A, Shum S B, Quinto I, et al. Discourse-centric learning analytics[A]. Proceedings of the 1st International Conference on Learning Analytics and Knowledge[C]. New York: ACM Press, 2011: 23-33.
[22] Xu Y, Reynolds N. Using text mining techniques to analyze students’ written responses to a teacher leadership dilemma[A]. Proceedings of the 2011 4th IEEE International Conference on Computer Science and Information Technology[C]. New York: ACM Press, 2011: 93-97.
[23] Melville P, Chenthamarakshan V, Lawrence R D, et al. Amplifying the voice of youth in africa via text analytics[A].Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining[C]. New York: ACM Press, 2013: 1204-1212.
[24] Chen, B. , & Resendes . Uncovering what matters: Analyzing sequential relations among contribution types in knowledge - building discourse[A]. In Proceedings of the Fourth International Conference on Learning Analytics and Knowledge[C]. New York: ACM Press, 2014: 226-230.
[25] Enck W, Xie T. Tutorial:Text Analytics for Security[A]. Proceedings of the 2014 ACM SIGSAC Conference on Computer and Communications Security[C]. New York: ACM Press, 2014: 1540-1541.
[26] Kontogiannis S, Valsamidis S, Kazanidis I, et al. Course opinion mining methodology for knowledge discovery, based on web social media[A].Proceedings of the 18th Panhellenic Conference on Informatics[C]. New York: ACM Press, 2014: 1-6.
[27] M.K. Underwood, L.H. Rosen, D. More,et al. The BlackBerry project: capturing the content of adolescents' text messaging [J]. Developmental Psychology, 2012,48(2): 295-302.
[28] Ehrenreich S E, Underwood M K, Ackerman R A. Adolescents’ Text Message Communication and Growth in Antisocial Behavior Across the First Year of High School[J]. Journal of abnormal child psychology, 2014, 42(2): 251-264.
[29] L.J. Austin. How to do things with words [M]. Oxford: Oxford University Press, 1962.
[30] Yu W B, Luna R. Exploring user feedback of a e-learning system: a text mining approach[M]. Las Vegas: Springer Berlin Heidelberg, 2013.
[31] Panian Z. Text analytics as a form of knowledge mining[A]. Proceedings of the 4th conference on European computing conference[C]. World Scientific and Engineering Academy and Society (WSEAS), 2010: 112-117.
[32] Munezero M, Montero C S, Mozgovoy M, et al. Exploiting sentiment analysis to track emotions in students' learning diaries[A]. Proceedings of the 13th Koli Calling International Conference on Computing Education Research[C]. New York: ACM Press, 2013: 145-152.
[33] C Hsu J L, Chou H W, Chang H H. EduMiner: Using text mining for automatic formative assessment[J]. Expert Systems with Applications, 2011, 38(4): 3431-3439.
[34] Lau T P, Wang S, Man Y, et al. Language technologies for enhancement of teaching and learning in writing[A]. Proceedings of the companion publication of the 23rd international conference on World wide web companion. International World Wide Web Conferences Steering Committee[C]. New York: ACM Press, 2014: 1097-1102.
[35] Kardan S, Conati C. A Framework for Capturing Distinguishing User Interaction Behaviors in Novel Interfaces[A]. EDM[C]. New York: ACM Press, 2011: 159-168.
[36] Klein R, Kyrilov A, Tokman M. Automated assessment of short free-text responses in computer science using latent semantic analysis[A]. Proceedings of the 16th annual joint conference on innovation and technology in computer science education[C]. New York: ACM Press, 2011.
[37] Simsek D, Shum S B, De Liddo A, et al. Visual analytics of academic writing[A]. Proceedins of the Fourth International Conference on Learning Analytics And Knowledge[C]. New York: ACM Press, 2014: 265-266.
[38] He W. Examining students’ online interaction in a live video streaming environment using data mining and text mining[J]. Computers in Human Behavior, 2013, 29(1): 90-102.
[39] Wen M, Yang D, Rosé C P. Sentiment Analysis in MOOC Discussion Forums: What does it tell us[J]. Proceedings of Educational Data Mining, 2014, 45(4): 1-8.
[40] Chiu, M. M., & Fujita, N. Statistical discourse analysis of online discussions: Informal cognition, social metacognition and knowledge creation[A]. In Proceedings of the Fourth International Conference on Learning Analytics And Knowledge[C]. New York: ACM Press, 2014: 217-225.
[41] Leong, C-K., Lee, Y-H., & Mak, W-K.Mining sentiments in SMS texts for teaching evaluation[J]. Expert Systems with Applications, 2012, 39(3): 2584-2589.
[42] Gašević D, Mirriahi N, Dawson S. Analytics of the effects of video use and instruction to support reflective learning[A]. Proceedins of the Fourth International Conference on Learning Analytics And Knowledge[C].New York: ACM Press, 2014: 123-132.
[43] M. Abdous and W. He,Using text mining to uncover students' technology-related problems in live video streaming[J]. British Journal of Educational Technology, 2011, 42(1): 40-49.
[44] Lin, F. R., Hsieh, L. S., & Chuang, F. T. Discovering genres of online discussion threads via text mining[J]. Computers & Education, 2009, 52(2), 481–495.
[45] De Liddo A, Shum S B, Quinto I, et al. Discourse-centric learning analytics[A]. Proceedings of the 1st International Conference on Learning Analytics and Knowledge[C]. New York: ACM Press, 2011: 23-33.
[46] Dasigi P, Guo W, Diab M. Genre independent subgroup detection in online discussion threads: a pilot study of implicit attitude using latent textual semantics[A].Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics:Short Papers-Volume 2[C]. New York: ACM Press, 2012.
[47] Tausczik Y R, Pennebaker J W. The psychological meaning of words: LIWC and computerized text analysis methods[J]. Journal of language and social psychology, 2010, 29(1): 24-54.
[48] Drieger P. Semantic network analysis as a method for visual text analytics[J]. Procedia-Social and Behavioral Sciences, 2013, 79(2): 4-17.
以上是关于基于文本挖掘的学习分析应用研究的主要内容,如果未能解决你的问题,请参考以下文章