干货合集│最好用的 python 库都在这

Posted 程序员亮仔

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了干货合集│最好用的 python 库都在这相关的知识,希望对你有一定的参考价值。

一、分词 - jieba

  • 优秀的中文分词库,依靠中文词库,利用词库确定汉子之间关联的概率,形成分词结果
import jieba

word = 伟大的中华人民共和国

jieba.cut(word)
jieba.lcut(word)


二、词云库 - wordcloud

  • 对数据中出现频率较高的关键词 生成的一幅图像,予以视觉上的突出
import jieba
import numpy as np
import PIL.Image as Image
from wordcloud import WordCloud

def run(word_path, picture_path):
with open(word_path, r) as f:
word = f.read()

cut_word = .join(jieba.cut(word))
color_mask = np.array(Image.open(picture_path))

word_cloud = WordCloud(
# 设置字体,不指定就会出现乱码
font_path=/System/Library/Fonts/PingFang.ttc,
# 设置背景色
background_color=white,
# 词云形状
mask=color_mask,
# 允许最大词汇
max_words=120,
# 最大号字体
max_font_size=2000
).generate(cut_word)

word_cloud.to_file(word_cloud.jpg)
im = word_cloud.to_image()
im.show()


三、可视化进度条 - tpdm

  • 好看的进度条,不仅会让人一眼就知道任务的进度,还能够让自己的心情愉悦
from time import sleep
from tqdm import tqdm

# 这里同样的,tqdm就是这个进度条最常用的一个方法
# 里面存一个可迭代对象
for i in tqdm(range(1, 500)):
# 模拟你的任务
sleep(0.01)
sleep(0.5)


四、优美的表格 - PrettyTable

  • 可以让你在命令行打印出优美的表格
import prettytable as pt

# 按行添加数据
tb = pt.PrettyTable()
tb.field_names = [name, age, height, weight]
tb.add_row([亮仔, 25, 174, 65])
tb.add_row([程序员, 23, 164, 55])
tb.add_row([程序员亮仔, 27, 184, 69.5])

print(tb)

# +-----------+-----+--------+--------+
# | name | age | height | weight |
# +-----------+-----+--------+--------+
# | 亮仔 | 25 | 174 | 65 |
# | 程序员 | 23 | 164 | 55 |
# | 程序员亮仔 | 27 | 184 | 69.5 |
# +-----------+-----+--------+--------+


五、多进程 - multiprocessing

  • 创建多进程
from multiprocessing import Process

def func(s):
print(s)

if __name__ == __main__:
process = [
Process(target=func, args=(1, ))
Process(target=func, args=(2, ))
]

[p.start() for p in process]
[p.join() for p in process]


六、多线程 - threading

  • 创建多线程
import threading

def func(s):
print(s)

if __name__ == __main__:
thread = [
threading.Thread(target=func, args=(1, ))
threading.Thread(target=func, args=(2, ))
]

[t.start() for t in thread]
[t.join() for t in thread]


七、谷歌翻译 - googletrans

  • 自动语言检测,批量翻译,语言检测等
from googletrans import Translator

translator = Translator()
# 未提供源语言以及翻译的最终语言,会自动翻译成英文
translator.translate(안녕하세요.)
# 告诉它翻译成什么语言
translator.translate(안녕하세요., dest=ja)
# 告诉它源语言是什么
translator.translate(程序员亮仔, src=zh-cn)

# 语言检测
t = ttranslator.detect(이 문장은 한글로 쓰여졌습니다.)
t.lang


八、重复回调 - retrying

  • 如果请求失败,我们需要再重新进行进行请求,防止请求异常导致数据缺失
from retrying import retry

@retry(stop_max_attempt_number=5)
def say():
try:
cxyliangzai
except Exception as e:
# 可以将错误记录日志
print(e)
raise

say()


九、游戏开发 - pygame

  • 实现 python 游戏的开发,可以开发各种大小型游戏
import pygame, sys
from pygame.locals import *

# 初始化pygame
pygame.init()

# 设置窗口的大小,单位为像素
screen = pygame.display.set_mode((500,400), 0, 32)

# 设置窗口的标题
pygame.display.set_caption(用户事件监控)

# 设置背景
screen.fill((255, 255, 255))

# 程序主循环
while True:
# 获取事件
for 干货 | 28本大数据/数据分析/数据挖掘电子书合集免费下载!

#yyds干货盘点# 听说过python协程没?听说过 asyncio 库没?都在这一篇博客了

最好的JavaScript数据可视化库都在这里了

干货 | 10个最好用的PHP框架,请收好~

Sketch上最好用的插件合集

干货书集合20+机器学习/深度学习/python开放书合集