NLP | TextRank文章摘要提取算法流程
Posted AI算法攻城狮
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了NLP | TextRank文章摘要提取算法流程相关的知识,希望对你有一定的参考价值。
TextRank算法是一种抽取式的无监督的文本摘要方法。
TextRank文章摘要提取算法流程:
1. 第一步是把所有文章整合成文本数据
2. 接下来把文本分割成单个句子
3. 我们将为每个句子找到向量表示(词向量)。
4. 计算句子向量间的相似性并存放在矩阵中
5. 然后将相似矩阵转换为以句子为节点、相似性得分为边的图结构,用于句子TextRank计算。
6. 最后,一定数量的排名最高的句子构成最后的摘要。
以上是关于NLP | TextRank文章摘要提取算法流程的主要内容,如果未能解决你的问题,请参考以下文章