NLP | TextRank文章摘要提取算法流程

Posted AI算法攻城狮

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了NLP | TextRank文章摘要提取算法流程相关的知识,希望对你有一定的参考价值。

TextRank算法是一种抽取式的无监督的文本摘要方法。

TextRank文章摘要提取算法流程:

 1. 第一步是把所有文章整合成文本数据

2. 接下来把文本分割成单个句子

3. 我们将为每个句子找到向量表示(词向量)。

4. 计算句子向量间的相似性并存放在矩阵中

5. 然后将相似矩阵转换为以句子为节点、相似性得分为边的图结构,用于句子TextRank计算。

6. 最后,一定数量的排名最高的句子构成最后的摘要。

以上是关于NLP | TextRank文章摘要提取算法流程的主要内容,如果未能解决你的问题,请参考以下文章

基于TextRank提取关键词关键短语摘要

HanLP 关键词提取算法分析

TextRank算法是什么?基于TextRank算法进行关键词抽取

SnowNLP 使用自定义语料进行模型训练

SnowNLP 使用自定义语料进行模型训练

TextRank 文本摘要