NLP | TextRank算法介绍及实现

Posted AI算法攻城狮

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了NLP | TextRank算法介绍及实现相关的知识,希望对你有一定的参考价值。

1、PageRank算法

PageRank算法通过计算网页链接的数量和质量来粗略估计网页的重要性,算法创立之初即应用在谷歌的搜索引擎中,对网页进行排名。 

PageRank算法的核心思想如下:

(1)链接数量:如果一个网页被越多的其他网页链接,说明这个网页越重要,即该网页的PR值(PageRank值)会相对较高;

(2)链接质量:如果一个网页被一个越高权值的网页链接,也能表明这个网页越重要,即一个PR值很高的网页链接到一个其他网页,那么被链接到的网页的PR值会相应地因此而提高。

PageRank算法计算公式:

PageRank算法论文:The PageRank Citation Ranking: Bringing Order to the Web

2、TextRank算法

TextRank算法是一种基于图的用于关键词抽取和文档摘要的排序算法,由谷歌的网页重要性排序算法PageRank算法改进而来,它利用一篇文档内部的词语间的共现信息(语义)便可以抽取关键词,它能够从一个给定的文本中抽取出该文本的关键词、关键词组,并使用抽取式的自动文摘方法抽取出该文本的关键句。

TextRank算法的基本思想是将文档看作一个词的网络,该网络中的链接表示词与词之间的语义关系。

TextRank算法计算公式:<

以上是关于NLP | TextRank算法介绍及实现的主要内容,如果未能解决你的问题,请参考以下文章

NLP | TextRank文章摘要提取算法流程

关键字提取算法TF-IDF和TextRank(python3)————实现TF-IDF并jieba中的TF-IDF对比,使用jieba中的实现TextRank

文本自动摘要:基于TextRank的中文新闻摘要

nlp中语言模型的建立及平滑算法介绍

基于TextRank提取关键词关键短语摘要

社区说 | 对比学习前沿进展及 TensorFlow 实现