Textblob 情感算法

Posted

技术标签:

【中文标题】Textblob 情感算法【英文标题】:Textblob sentiment algorithm 【发布时间】:2017-09-27 01:32:52 【问题描述】:

有人知道 textblob 情绪是如何工作的吗?我知道它基于 Pattern 工作,但我找不到任何文章或文档解释模式如何为句子分配极性值。

【问题讨论】:

***.com/a/34519114/5575289 我认为这个链接解释了你需要什么。 gench 的答案应该是正确的答案,而 DhruvPathak 的答案是部分的。 【参考方案1】:

这里是textblog情感模块的代码: https://github.com/sloria/TextBlob/blob/90cc87ab0f9e25f37379079840ec43aba59af440/textblob/en/sentiments.py

如您所见,它有一个包含预先分类的电影评论的训练集,当您提供新文本进行分析时,它使用 NaiveBayes 分类器将新文本的极性分类为posneg 概率。

【讨论】:

【参考方案2】:

默认情况下,它会使用形容词词典及其手工标记分数来计算给定文本中每个单词的平均极性主观性。它实际上使用了pattern 库,它从sentiwordnet 中获取单个单词的分数。

如果您通过指定 NaiveBayesAnalyzer 来调用情绪分数,例如

TextBlob("这部电影很棒!", analyzer=NaiveBayesAnalyzer())

然后它将通过在电影评论数据集上训练的 NaiveBayesAnalyzer 计算情绪得分。

【讨论】:

这应该表示为正确答案,而 DhruvPathak 的答案是部分的。以下是库的 Github 上解决这一点的几个问题的链接:github.com/sloria/TextBlob/issues/344#issuecomment-732193942 我第二次 @ArnoldVialfont 对此。 gench 的答案似乎是完整而正确的。

以上是关于Textblob 情感算法的主要内容,如果未能解决你的问题,请参考以下文章

python snownlp情感分析简易demo

TextBlob实战之朴素贝叶斯文本分类

Textblob 逻辑帮助。 NaiveBayes分类器

使用 TextBlob 库的最高极性得分(情绪分析)

TextBlob NaiveBayesAnalyzer 极慢(与 Pattern 相比)

用 nltk 训练我自己的分类器后,如何将它加载到 textblob 中?