使用 Python 进行数据可视化之Matplotlib

Posted 海拥✘

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用 Python 进行数据可视化之Matplotlib相关的知识,希望对你有一定的参考价值。

🌊 作者主页:海拥
🌊 作者简介:🏆CSDN全栈领域优质创作者、🥇HDZ核心组成员、🥈蝉联C站周榜前十
🌊 粉丝福利:粉丝群 每周送四本书,每月送各种小礼品(搪瓷杯、抱枕、鼠标垫、马克杯等)

直接跳到末尾 去评论区领书

在当今世界,我们每天都会产生大量数据。有时要分析某些趋势的数据,如果数据是原始格式,模式可能会变得困难。为了克服这种数据可视化发挥作用。数据可视化提供了良好的、有组织的数据图形表示,使其更易于理解、观察和分析。在本系列教程中,我们将讨论如何使用 Python 可视化数据。

我们将一一讨论这些库,并绘制一些最常用的图形。

注意: 如果您想了解有关这些库的深入信息,可以按照他们的完整教程进行操作。

在深入研究这些库之前,首先,我们需要一个数据库来绘制数据。我们将在本完整教程中使用 tips database。让我们讨论一下这个数据库的简介。

使用的数据库

tips 数据库

tips 数据库是20世纪90年代初期顾客在餐厅的两个半月的小费记录。它包含 6 列,例如 total_bill、tip、sex、smoker、day、time、size。

您可以从这里下载 tips 数据库。

例子:

import pandas as pd


# 读取数据库
data = pd.read_csv("tips.csv")

# 打印前 10 行
print(data.head(10))

输出:

Matplotlib

Matplotlib 是一个易于使用的低级数据可视化库,它构建在 NumPy 数组上。它由散点图、线图、直方图等各种图组成。 Matplotlib 提供了很大的灵活性。

要安装此库,请在终端中输入以下命令。

pip install matplotlib

安装 Matplotlib 后,让我们看看使用这个库最常用的绘图。

散点图

散点图用于观察变量之间的关系,并用点来表示它们之间的关系。matplotlib 库中的scatter()方法用于绘制散点图。

例子:

import pandas as pd
import matplotlib.pyplot as plt


# 读取数据库
data = pd.read_csv("tips.csv")

# day 对 tip 的散点图
plt.scatter(data['day'], data['tip'])

# 为 Plot 添加标题
plt.title("Scatter Plot")

# 设置 X 和 Y 标签
plt.xlabel('Day')
plt.ylabel('Tip')

plt.show()

输出:

如果我们可以添加颜色并更改点的大小,则此图会更有意义。我们可以通过分别使用 scatter 函数的c 和 s参数来做到这一点。我们还可以使用colorbar()方法显示颜色条。

import pandas as pd
import matplotlib.pyplot as plt


# 读取数据库
data = pd.read_csv("tips.csv")

# day对tip的散点图
plt.scatter(data['day'], data['tip'], c=data['size'],
			s=data['total_bill'])

# 为Plot添加标题
plt.title("Scatter Plot")

# 设置 X 和 Y 标签
plt.xlabel('Day')
plt.ylabel('Tip')

plt.colorbar()

plt.show()

折线图

折线图用于表示不同轴上两个数据 X 和 Y 之间的关系。它是使用plot() 函数绘制的。让我们看看下面的例子。

例子:

import pandas as pd
import matplotlib.pyplot as plt


# 读取数据库
data = pd.read_csv("tips.csv")

# day对tip的折线图
plt.plot(data['tip'])
plt.plot(data['size'])

# 为Plot添加标题
plt.title("Scatter Plot")

# 设置 X 和 Y 标签
plt.xlabel('Day')
plt.ylabel('Tip')

plt.show()

输出:

条形图

柱状图或叫条形图是表示与长度和高度的矩形条数据的类别是正比于它们所代表的值的图。它可以使用bar()方法创建。

例子:

import pandas as pd
import matplotlib.pyplot as plt


# 读取数据库
data = pd.read_csv("tips.csv")

# day对tip的条形图
plt.bar(data['day'], data['tip'])

plt.title("Bar Chart")

# 设置 X 和 Y 标签
plt.xlabel('Day')
plt.ylabel('Tip')

# 添加图例
plt.show()

输出:

直方图

直方图基本上是用来在一些基团的形式来表示数据。它是一种条形图,其中 X 轴表示 bin 范围,而 Y 轴提供有关频率的信息。的HIST()函数用于计算和创建直方图。在直方图中,如果我们传递分类数据,那么它将自动计算该数据的频率,即每个值出现的频率。

例子:

import pandas as pd
import matplotlib.pyplot as plt


# 读取数据库
data = pd.read_csv("tips.csv")

# total_bill直方图
plt.hist(data['total_bill'])

plt.title("Histogram")

# 添加图例
plt.show()

输出:

以上是关于 Matplotlib 使用 Python 进行数据可视化的全部示例,下一节我们来谈谈 Seaborn

🥇 评论区抽粉丝送书啦

💌 欢迎大家在评论区提出意见和建议! (抽两位幸运儿送书,实物图如下)💌

《Python大数据分析从入门到精通》

【内容简介】

本书结合Python在数据分析领域的特点,介绍如何在数据平台上集成使用Python。本书内容分为3大部分。第1部分(第1~ 3章)为搭建开发环境和导入测试数据;第2部分(第4~ 12章)为Python对HDFS、Hive、Pig、HBase、Spark的操作,主要是对常用API的说明;第3部分(第13~16章)是在前面章节的基础上,介绍如何进行数据的分析、挖掘、可视化等内容。
  本书不仅阐述了Python在大数据平台上的应用技巧,而且关于大数据平台管理和操作的介绍说明贯穿全书,因此对于希望学习大数据知识的读者,本书同样非常适合。

也有不想靠抽,想自己买的同学可以参考下面的链接

京东自营购买链接:

《Python大数据分析从入门到精通》- 京东图书

当当自营购买链接:

《Python大数据分析从入门到精通》- 当当图书

🥇 Python 进行数据可视化系列汇总

📣 注意:

大家点赞关注,三天后也就是 10月29日 从评论区留言的同学中抽取两位送书

🌊 面试题库:Java、Python、前端核心知识点大全和面试真题资料
🌊 电子图书:图灵程序丛书 300本、机械工业出版社6000册免费正版图书
🌊 办公用品:精品PPT模板几千套,简历模板一千多套
🌊 学习资料:2300套PHP建站源码,微信小程序入门资料

如果中奖了联系不上则视为放弃,可以从下方公众号里找到作者的联系方式,每周都会送四本书,后面送书力度还会加大,一年送几百上千本不是问题,回复【进群】领书不迷路,群内 每位成员 我都会送一本。回复【资源】可获取上面的资料👇🏻👇🏻👇🏻

以上是关于使用 Python 进行数据可视化之Matplotlib的主要内容,如果未能解决你的问题,请参考以下文章

JAVA三维可视化组件:Matplot 3D for JAVA(V3.0) 一个纯JAVA开发的科学数据可视化组件包 类似 Python 的matplotlib(含示例代码)

matplotlib可视化篇之并列柱状图--直方图(3)

Python交互图表可视化Bokeh:1. 可视交互化原理| 基本设置

在matplot Python中格式化日期时间

Python之神奇的绘图库matplotlib

使用 Python 进行数据可视化之Seaborn