硬核提效工具!发现5个应该立即开始学习的Python库

Posted Python学习与数据挖掘

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了硬核提效工具!发现5个应该立即开始学习的Python库相关的知识,希望对你有一定的参考价值。

Python 最好的地方就是它拥有无限的开源库,基本上什么库都有。如果你读过我以前的一些文章,你可能已经注意到我非常喜欢分享一些 Python 提效工具库。

如果一个库能帮助我们解决一个问题,为什么不省下宝贵的时间来尝试一下呢?今天,我将向大家介绍5个你可能从未听说过的库,但你应该添加到学习计划中。我们开始吧!

PyForest

当你开始为一个项目输入代码时,你的第一步是什么?你可能会导入你需要的库,对吧?问题是你永远不知道你需要多少库,直到代码运行出现一个错误bug。这也是为什么 PyForest 是我所知道的最方便的库之一。它可以用一行代码将40个最流行的库导入到你的脚本中。

使用方法

安装如下:

pip install pyforest

要将其导入笔记本,只需要如下操作:

from pyforest import *

我们就可以开始使用库了。要检查导入了哪些库,请输入:

lazy_imports()


以上所有的库都很好用。从技术上讲,它们只有在你使用的时候才会被 importe。否则,他们不会。你可以看到诸如Pandas、Matplotlib、Seaborn、Tensorflow、Sklearn、NLTK、XGBoost、Plotly、Keras、Numpy等库。

Emot

Emot 是一个很好的库,它将表情和表情符号转换为描述性信息。对于那些不熟悉的人来说,表情符号是用人物来表达情感的方式。

使用方法

要安装它,可以输入

pip install emot

让我们用一个例子来检验一下:

它返回一个包含值、描述和位置的字典。像任何字典一样,你可以把它切分开来,专注于你需要的信息。如果我键入ans[‘mean’],它将只返回表情符号描述。

Geemap

Geemap 是一个 Python 库,它可以与谷歌地球引擎进行交互式映射。你可能对谷歌地球引擎及其所有功能都很熟悉,那么为什么不在下一个项目中使用它呢?

使用方法

你可以通过在终端中输入

pip install geemap

来安装它。要将其导入脚本中,可以键入

import geemap

出于演示目的,我将使用以下代码创建一个基于 folium 的交互式地图:

import geemap.eefolium as geemap
Map = geemap.Map(center=[40,-100], zoom=4)
Map

在这里插入图片描述

更多资料可以参考Github链接:https://github.com/giswqs/geemap

Dabl

Dabl 的目标是使初学者进行机器学习建模更容易,它在机器学习项目中使用低代码解决方案。Dabl简化了数据清理、创建可视化、构建基线模型和解释模型。让我们快速回顾一下它的一些功能。

使用方法

首先,要安装它,只需在终端中输入

pip install dabl

你可以使用:

dabl.clean(data)

来获取有关特性的信息,它还显示了连续性、范畴性和高基数特性。

可以使用 dabl.clean(data) 生成有关特定函数的可视化:

在这里插入图片描述

你可以使用

dabl.AnyClassifier 
#or
dabl.Simplefier()

用一行代码创建多个模型,就像使用 Scikit Learn 一样。例如创建训练和测试数据集、调用、拟合和预测模型。然后,可以使用 Scikit Learn 评估模型。

# Setting X and y variables
X, y = load_digits(return_X_y=True)
# Splitting the dataset into train and test sets
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=1)
# Calling the model
sc = dabl.SimpleClassifier().fit(X_train, y_train)
# Evaluating accuracy score
print(“Accuracy score”, sc.score(X_test, y_test))

在这里插入图片描述

我们可以看到,Dabl迭代了多个模型,包括虚拟分类器、不同深度的决策树和Logistic回归。最后给出了最佳模型。所有这些模型只需10秒钟。很酷,对吧?我决定使用 Scikit-Learn 来测试最终的模型,以确保这个结果是可信的。结果如下:

我用传统的预测方法得到了0.968的准确度,用 Dabl 得到了0.971的准确度,对我来说已经够近了!

Sweetviz

Sweetviz 是一个低代码的 Python 库,它生成漂亮的可视化效果,用两行代码启动探索性数据分析。输出是一个交互式 html 文件。

使用方法

my_report = sv.analyze(dataframe)
my_report.show_html()


你看到了吗?Sweetviz 能够创建一个 EDA HTML 文件,其中包含关于整个数据集的信息,并将其分解,以便你可以单独分析每个特性,同时可以获得与其他特征(最大值、最小值和最频繁值)的数字和分类关联。可视化效果也会根据数据类型而变化,你可以用 Sweetviz 做更多的有意义的事情。

结论

PyForest、Emot、Geemap、Dabl和Sweeviz是值得了解的库,因为它将复杂的任务转化为简单的任务。如果使用这些库,你将节省宝贵的时间处理那些重要的任务。我建议你亲手试试看,并探索他们的功能。如果你有新的发现,可以留言区留言。


技术交流

欢迎转载、收藏、有所收获点赞支持一下!

在这里插入图片描述
目前开通了技术交流群,群友超过2000人,添加方式如下:

如下方式均可,添加时最好方式为:来源+兴趣方向,方便找到志同道合的朋友

  • 方式一、发送如下图片至微信,进行长按识别,回复加群;
  • 方式二、直接添加小助手微信号:pythoner666,备注:来自CSDN
  • 方式三、微信搜索公众号:Python学习与数据挖掘,后台回复:加群

在这里插入图片描述

以上是关于硬核提效工具!发现5个应该立即开始学习的Python库的主要内容,如果未能解决你的问题,请参考以下文章

你应该知道的 5 个 Docker 工具

你应该知道的 5 个 Docker 工具

硬核!如何全面系统地自学Java

省时提效!5个必知必会的 SQL 窗口函数!

如何做好企业账号自营,有啥提效工具吗?

如何使用Windows内存诊断工具发现内存问题