9大Python最常用的数据分析库,在2018都做了哪些更新?
Posted python6359
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了9大Python最常用的数据分析库,在2018都做了哪些更新?相关的知识,希望对你有一定的参考价值。
![技术分享图片](https://image.cha138.com/20210705/d1350f2c1d24471fb74605364c5cb00d.jpg)
1. NumPy
![技术分享图片](https://image.cha138.com/20210705/c5525840d1bb4afbb6d8c8df3ae0437a.jpg)
一般我们会将科学领域的库作为清单打头,NumPy是该领域的主要软件库之一。它旨在处理大型的多维数组和矩阵,并提供了很多高级的数学函数和方法,因此可以用它来执行各种操作。
在过去一年,开发团队对该库进行了大量改进。除了错误修复和解决兼容性问题之外,关键的变更还包括样式改进,即NumPy对象的打印格式。此外,一些函数现在可以处理任意编码的文件,只要这些编码受Python支持。
2. SciPy
![技术分享图片](https://image.cha138.com/20210705/78d3670d3deb4070a22f44f694bebb7e.jpg)
另一个科学计算核心库SciPy,基于NumPy而构建,并扩展了NumPy的功能。SciPy的主要数据结构是多维数组,使用Numpy实现。该库提供了一些用于解决线性代数、概率论、积分计算等任务的工具。
SciPy通过与不同的操作系统进行持续集成的方式带来了重大改进,比如新的函数和方法,更重要的是——最新的优化器。此外,开发团队对很多新的BLAS和LAPACK函数进行了包装。
3.Pandas
![技术分享图片](https://image.cha138.com/20210705/d937b067b96f4ec0b2942f33d5c70e4a.jpg)
Pandas是一个Python库,提供了高级的数据结构和各种分析工具。该库的一大特色是能够将相当复杂的数据操作转换为一两个命令。Pandas提供了很多内置的方法,用于分组、过滤和组合数据,还提供了时间序列功能。所有这些方法的执行速度都很快。
新发布的pandas库还提供了数百个新特性、功能增强、错误修复和API变更。这些改进与Pandas对数据进行分组和排序的能力有关,支持自定义类型操作。
4. StatsModels
![技术分享图片](https://image.cha138.com/20210705/c3e4b1e68a624818a67c4c6a0c0e09bf.jpg)
Statsmodels是一个Python模块,为统计数据分析提供了很多可能性,例如统计模型估计、运行统计测试等。你可以借助它来实现很多机器学习方法,并探索不同的绘图可能性。
该库在不断演化,带来了更多的可能性。今年带来了时间序列改进和新的计数模型GeneralizedPoisson、零膨胀模型和NegativeBinomialP,以及新的多变量方法因子分析、MANOVA和ANOVA的重复测量。
可视化
5. Matplotlib
![技术分享图片](https://image.cha138.com/20210705/744e6e8a7bab4148883250e39322c4d5.jpg)
Matplotlib是一个用于创建二维图表和图形的低级库。你可以用它来构建各种图表,从直方图和散点图到非笛卡尔坐标图。此外,很多流行的绘图库都为Matplotlib预留了位置,可与Matplotlib结合在一起使用。
该库在绘图样式方面做出了很多变更,如颜色、尺寸、字体、图例等。例如,坐标轴图例的自动对齐和对色盲患者更友好的色环。
![技术分享图片](https://image.cha138.com/20210705/f2e3e6bba066491d8e78b95bf680e382.jpg)
6. Seaborn
Seaborn实际上是基于matplotlib库构建的高级API。它为处理图表提供了更恰当的默认选项。此外,它还提供了一组丰富的可视化图库,包括时间序列、联合图和小提琴图等复杂的类型。
Seaborn的更新主要是问题修复。不过,FacetGrid(或PairGrid)与增强的交互式matplotlib后端之间的兼容性有所改进,为可视化添加了参数和选项。
![技术分享图片](https://image.cha138.com/20210705/99c57ceaee884093a3b7e973b2e50a85.jpg)
7. Plotly
Plotly是一个可以帮助你轻松构建复杂图形的流行库。该库适用于交互式Web应用程序,它提供了很多很棒的可视化效果,包括轮廓图形、三元图和3D图表。
这个库在持续地增强和改进,带来新的图形和特性,支持“多链接视图”、动画和串扰集成。
8. Bokeh
Bokeh库使用JavaScript小部件在浏览器中创建交互式和可伸缩的可视化图形。该库提供了多种图形、样式、链接图形式的交互能力、添加小部件、定义回调以及更多有用的功能。
Bokeh改进的交互式功能值得称赞,例如可旋转的分类刻度标签,以及小型的缩放工具和自定义工具提示字段增强。
![技术分享图片](https://image.cha138.com/20210705/e0c1c786c4834b4e930f330f5376972c.jpg)
9. Pydot
Pydot是一个用于生成面向复杂图形和非面向复杂图形的库。它作为面向Graphviz的一个接口,使用Python编写。我们可以借助它来显示图形的结构,这在构建神经网络和基于决策树的算法时经常会用到。
![技术分享图片](https://image.cha138.com/20210705/ff10d3d38e134e3b8c726c4735c2ccfb.jpg)
以上是关于9大Python最常用的数据分析库,在2018都做了哪些更新?的主要内容,如果未能解决你的问题,请参考以下文章