从频率词典中获取字数和平均长度

Posted

技术标签:

【中文标题】从频率词典中获取字数和平均长度【英文标题】:Get word count and average length from frequency dictionary 【发布时间】:2013-12-07 17:23:27 【问题描述】:

如果我有一个频率词典,其中包含文本中的单词作为键,它们在文本中出现的次数作为值。如何通过确保考虑多次出现的单词来获得字数和平均长度?现在我所要做的就是制作一个键列表(因为它们是单词),然后使用 len() 来计算字数。

wordcount=len(list(freq.keys()))
report["count:"]=wordcount
#for average length:
avg=list(freq.keys())
average=sum(map(len,avg))/len(avg)
report["avglen"]=average

【问题讨论】:

len(freq) 足以计算字数。 【参考方案1】:

使用sum 函数和dict.values()

freq =  'test' : 10, 'rep' : 100 
wordcount = sum(freq.values())
average   = sum(len(w) * c for w, c in freq.items()) / wordcount
print(wordcount, average)

【讨论】:

【参考方案2】:
number_of_words  = int(raw_input("Enter the number of words. "))

word_dict = 

for i in range(number_of_words):
    word = raw_input("Enter word. ")
    if word in word_dict:
        word_dict[word] += 1
    else:
        word_dict[word] = 1

print word_dict

print sum([len(word)*word_dict[word] for word in word_dict])/number_of_words

一个非常相似的问题:https://***.com/questions/20143947/word-frequency-counter-python/20145320#20145320

【讨论】:

以上是关于从频率词典中获取字数和平均长度的主要内容,如果未能解决你的问题,请参考以下文章

频率分布直方图,的概念与应用?

语音情感识别中的 MFCC(梅尔频率系数的平均值对性能的影响)

pwm频率和占空比的区别

如何从录制原始音频中获取频率?

从波形文件中获取频率和幅度

在 Excel 中计算下订单的频率(最小/最大/平均)