自动文摘和权值

Posted bcbobo21cn

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了自动文摘和权值相关的知识,希望对你有一定的参考价值。

自动文摘

运用计算机技术摘取文章;
自动文摘,利用计算机自动地从原始文献中提取文摘;文摘是全面准确地反映某一文献中心内容地简单连贯的短文;

自动摘录将文本试为句子的线性序列,将句子视为词的线性序列。它通常分4步进行:
(1)计算词的权值;
(2)计算句子的权值;
(3)将原文中的所有句子按权值高低降序排列,权值最高的若干句子被确定为文摘句;
(4)将所有文摘句按照它们在原文中的出现顺序输出;

自动文摘是自然语言处理功能中的一种;

程序处理的过程需要计算权值;下面来看一下什么是权值;

权值 

在数学领域,权值指加权平均数中的每个数的频数,也称为权数或权重;
加权平均数是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算;
这大约是概率方面的问题;

在计算机数据结构领域,权值是树或者图两个结点路径上的值,这个值表明一种代价,如从一个结点到达另外一个结点的路径的长度、所花费的时间、付出的费用等;

在计算机领域,大约的意思就是;办一件事情有N种方法,每种方法在不同方面各有其代价;例如花费的时间各不相同,这是各方法在时间的权值;花费的金钱各不相同,这是金钱方面的权值;花费的人力各不相同,这是人力方面的权值;

如果写过一个程序来计算或求解就会完全理解;


 

以上是关于自动文摘和权值的主要内容,如果未能解决你的问题,请参考以下文章

使用 TF-IDF 加权的空间向量模型实现句子相似度计算

[BZOJ]3531: [Sdoi2014]旅行

局部加权回归法是啥

P1351 联合权值

离散数学权值怎么算

20190616 权值线段树