齐普夫定律的起源
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了齐普夫定律的起源相关的知识,希望对你有一定的参考价值。
参考技术A关于单词在文献中出现频次的齐普夫定律(Zipf's Law)。亦称省力法则。1948年由美国哈佛大学语言学教授G.K.齐普夫(George K. Zipf )对英语文献中单词出现的频次进行大量统计以检验前人的定量化公式而提出的。该定律指出文章中单词的频次(f)与其排列的序号(r)之间存在着下述定量的关系,齐普夫认为:如果有一个包含n 个词的文章,将这些词按其出现的频次递减地排序,那么序号r和其出现频次f之积fr,将近似地为一个常数,即fr=b,(式中r=1,2,3.…),即词频分布定律最普通而又最典型的表达。 此后, 许多工具书大 都采用类似观点和说法 。如英国著名的语言学著作《语言与语言词典》 中的释义是:“(词频分布定律) 是指谈话者或写作者使用的词的分布和频次的总描述。F×R=C,方程式中F=频次,R=序号,即频率表上的位置;C=常数。方程式表示词使用的总次数和词频表上的位置之间有一个固定比率。”但是齐普夫的表达仅适宜于中频词的情况,高频与低频词与该表述偏差较大。于是对词频分布规律又有许多补充和深化的研究。
· ·George Kingsley Zipf observed that the frequency of usage of any word in a corpus is approximately inversely proportional to its frequency rank:
·
-i.e., the power law fr ~ 1 / rk, where r is rank and k≈ 1.
以上是关于齐普夫定律的起源的主要内容,如果未能解决你的问题,请参考以下文章