文本挖掘的概念
Posted 文蔚管理
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了文本挖掘的概念相关的知识,希望对你有一定的参考价值。
文本挖掘的概念——知识管理专题Day191
开场
今天分享文本挖掘的概念。
正文
文本挖掘作为知识挖掘的一个新主题,引起了人们的极大兴趣,同时,它也是一个富于争议的研究方向,目前尚无统一的定义。
文本挖掘(Text mining),是指从文本数据中抽取有价值的信息和知识的计算机处理技术。借鉴郭冲阳(Choon Yang Quek)对eb挖掘的定义,这里给出文本挖掘的定义:文本挖掘是指从大量文本的集合C中发现隐含的模式p。如果将C看作输入,将p看作输出,那么文本挖掘的过程就是从输入到输出的一个映射ξ:C→p。
文本挖掘是一个边缘学科,由机器学习、数理统计、自然语言处理等多种学科交叉形成。文本挖掘是应用驱动的,它在智能商务(Business intelligence)信息检索(Information retrieval)、生物信息处理(Bioinformatics)等方面都有广泛的应用,如客户关系管理(Customer relationship management),互联网搜索(Web search)等。
在现实生活中,许多领域都不断产生海量数据,特别是海量的文本数据。怎样从这些数据中抽取和发掘有用的信息和知识已成为一个日趋重要的问题。由于这个原因,文本挖掘虽是一个新兴学科,但已成为一个引人瞩目,且发展迅速。
对文本挖掘的理解可以用下图来说明。
这个图由三部分组成:底层是文本挖掘的基础领域,包括机器学习、数理统计、自然语言处理;在此基础上是文本挖掘的基本技术,有五大类,包括文本信息抽取、文本分类、文本聚类、文本数据压缩、文本数据处理;在基本技术之上是两个主要应用领域,包括信息访问和知识发现,信息访问包括信息检索、信息浏览、信息过滤、信息报告,知识发现包括数据分析、数据预测。
总之,对文本数据的分类、融合、压缩摘要以及从文本中抽取发现知识与信息都是文本挖掘的内容。
结尾
今天分享了文本挖掘的概念。
另外重要事项:
为方便大家获取学习知识,我们将每天在群中分享学习资源,欢迎加入,欢迎推广。群二维码如下:
1
Day4:
Day5:
Day6:
Day7:
职能
ay74:知识
那么我们如何学习和管理知识呢?我们:
了解知识 → 管理知识 → 实践知识
目标是永恒的方向,行动是成长的阶梯
更多精彩....
幸福聚-共享成长社群
以上是关于文本挖掘的概念的主要内容,如果未能解决你的问题,请参考以下文章