python_如何统计序列中元素

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python_如何统计序列中元素相关的知识,希望对你有一定的参考价值。

问题1:

       随机数列[12,5,8,7,8,9,4,8,5,...] 中出现次数最高的3个元素,他们出现的次数

问题2:

       对某英文文章的单词,进行词频统计,找出出现次数最搞得10个单词,他们出现的次数是多少?

上面问题都是以字典的形式保存结果

如何解决问题1?

       方法1:

#!/usr/bin/python3

from random import randint


def count_seq(data):
    
    # 初始化统计结果字典,data中的key作为结果字典的key,0作为每个key的初始值
    result_c = dict.fromkeys(data, 0)
    
    # 循环data,对字典中中碰到的值进行 +1 ,循环完成后就是结果
    for x in data:
        result_c[x] += 1
    return result_c

if __name__ == ‘__main__‘:
    # 生成20个随机数
    data = [randint(0, 20) for _ in range(20)]
    print(data)
    
    # 结果
    result_c = count_seq(data)
    for i in result_c:
        print(i, result_c[i])

       方法2:

              使用 collections下Counter对象

#!/usr/bin/python3

from random import randint
from collections import Counter


def count_seq(data):
    
    # 创建Counter对象,并把打他传递进去
    median_c = Counter(data)
    
    # 返回统计最大的3个数
    return median_c.most_common(3)

if __name__ == ‘__main__‘:
    # 生成20个随机数
    data = [randint(0, 20) for _ in range(20)]
    print(data)
    
    # 结果
    result_c = count_seq(data)
    print(result_c, dict(result_c))

问题2如何解决?

import re
from collections import Counter


def count_words():
    # 读取文件
    with open(‘english_article‘, ‘r‘, encoding=‘utf-8‘) as data:
        print()
        # 文件单词分割
        data_list = re.split(‘\W+‘, data.read())
    # 单词统计
    words = Counter(data_list)
    # 取单词统计最大的10个值
    return words.most_common(10)

if __name__ == ‘__main__‘:
    result = count_words()
    print(result)

以上是关于python_如何统计序列中元素的主要内容,如果未能解决你的问题,请参考以下文章

python基础一 ------如何统计一个列表元素的频度

python 统计序列中元素出现的频度,及最高的三个值

13 个非常有用的 Python 代码片段

如何统计序列中元素的频度

2-3课程 比较:统计序列中元素的出现频度

如何在 python 中并行化以下代码片段?