python sorted() count() set(list)-去重

Posted littlevigra

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python sorted() count() set(list)-去重相关的知识,希望对你有一定的参考价值。

2、用python实现统计一篇英文文章内每个单词的出现频率,并返回出现频率最高的前10个单词及其出现次数,并解答以下问题?(标点符号可忽略)

(1) 创建文件对象f后,解释f的readlines和xreadlines方法的区别?

(2) 追加需求:引号内元素需要算作一个单词,如何实现?

cat /root/text.txt

hello world 2018 xiaowei,good luck
hello kitty 2017 wangleai,ha he
hello kitty ,hasd he
hello kitty ,hasaad hedsfds

#我的脚本

#!/usr/bin/python
#get [‘a‘,‘b‘,‘c‘]
import re
with open(‘/root/text.txt‘) as f:
  openfile = f.read()

def get_list_dict():
  word_list = re.split(‘[0-9W]+‘,openfile)
  list_no_repeat = set(word_list)
  dict_word = {}
  for each_word in list_no_repeat:
    dict_word[each_word] = word_list.count(each_word)
  del dict_word[‘‘]
  return dict_word

#{‘a‘:2,‘c‘:5,‘b‘:1} => {‘c‘:5,‘a‘:2,‘b‘:1}
def sort_dict_get_ten(dict_word):
  list_after_sorted = sorted(dict_word.items(),key=lambda x:x[1],reverse=True)
  print list_after_sorted
  for i in range(3):
  print list_after_sorted[i][0],list_after_sorted[i][1]

def main():

      dict_word = get_list_dict()
      sort_dict_get_ten(dict_word)

if __name__ == ‘__main__‘:

   main()

[(‘hello‘, 4), (‘kitty‘, 3), (‘he‘, 2), (‘good‘, 1), (‘hasd‘, 1), (‘wangleai‘, 1), (‘hasaad‘, 1), (‘xiaowei‘, 1), (‘hedsfds‘, 1), (‘luck‘, 1), (‘world‘, 1), (‘ha‘, 1)]
hello 4
kitty 3
he 2
























以上是关于python sorted() count() set(list)-去重的主要内容,如果未能解决你的问题,请参考以下文章

python3关于sort(),sorted()

python字符串反转 高阶函数 @property与sorted

python list 中元素的统计与排序

python--几个重要内置函数(zip,fliter,map,sorted)

Count the number of occurrences in a sorted array

python_16