学习完整手写一个朴素贝叶斯分类器,完成文本分类
Posted 机器学习研究会
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了学习完整手写一个朴素贝叶斯分类器,完成文本分类相关的知识,希望对你有一定的参考价值。
Part 1: 本文解决的问题:
我在有这样的一个数据集,里面存放了人们对近期播放电影的评价,当然评价也就分成两部分,好评和差评。我们想利用这些数据训练一个模型,然后可以自动的对影评做出判断,到底是好评还是差评,差评的话,那么我们赶紧删掉它,哈哈。
好吧,这就是自然语言处理领域的基本问题:文本分类。文本分类在我们的日常生活中有非常多的应用,最有名的当属垃圾邮件过滤啦。我们肯定希望不要受到垃圾邮件,但是我们更不希望正常的邮件被当做垃圾邮件过滤掉了。这对我们分类的精度提出了很高的要求。
Part 4: 代码编写
Part4.1:文档和单词
原文链接:
http://mp.weixin.qq.com/s/hBkMWKNz-ktnjWSsZDNH-Q
以上是关于学习完整手写一个朴素贝叶斯分类器,完成文本分类的主要内容,如果未能解决你的问题,请参考以下文章
学习使用sklearn自带的贝叶斯分类器进行文本分类和参数调优
算法 | 使用sklearn自带的贝叶斯分类器进行文本分类和参数调优