介绍如何结合 Matplotlib
和 Pandas
实现数据的可视化.末尾我们将通过一个案例,将所学的内容应用到实际的数据分析中.这为接下来的实战案例之数据分析项目概述打下基础.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/65101.html
Matplotlib简介
Matplotlib
是 Python 中最常用的绘图库,能够生成多种类型的图表,如折线图、散点图、柱状图、饼图等.它的灵活性和强大的功能使它成为数据可视化的主要选择之一.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/65101.html
安装Matplotlib
如果还未安装 Matplotlib
,可以通过以下命令进行安装:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/65101.html
pip install matplotlib
与Pandas结合使用
在使用 Pandas
处理数据时,我们可以利用 Matplotlib
来更好地进行数据可视化.Pandas
的绘图功能是 Matplotlib
的封装,使用起来非常方便.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/65101.html
基本用法
让我们通过一个示例来了解如何结合使用 Pandas
和 Matplotlib
.假设我们有一个关于每月销售额的数据集,数据集如下:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/65101.html月份 销售额 1月 2000 2月 3000 3月 2500 4月 4000 5月 5000
我们可以将这个数据集存储为一个 Pandas
的 DataFrame,并使用 Matplotlib
进行可视化.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/65101.html
示例代码
import pandas as pd
import matplotlib.pyplot as plt
# 创建数据
data = {
'月份': ['1月', '2月', '3月', '4月', '5月'],
'销售额': [2000, 3000, 2500, 4000, 5000]
}
df = pd.DataFrame(data)
# 设置绘图风格
plt.style.use('seaborn-darkgrid')
# 绘制折线图
plt.figure(figsize=(10, 6))
plt.plot(df['月份'], df['销售额'], marker='o', linestyle='-', color='b')
plt.title('每月销售额变化')
plt.xlabel('月份')
plt.ylabel('销售额(元)')
plt.xticks(rotation=45)
plt.grid(True)
plt.tight_layout()
# 显示图表
plt.show()
代码解析
创建数据:我们将月和销售额的数据存入一个字典,然后转换为一个 Pandas
的 DataFrame.设置绘图风格:使用 plt.style.use()
方法设置绘图的风格.这里我们使用了seaborn-darkgrid
风格.绘制折线图:调用 plt.plot()
方法绘制销售额的折线图.我们设置了线条的样式、颜色和标记.添加标题和标签:通过 plt.title()
、plt.xlabel()
和plt.ylabel()
方法为图表添加标题和坐标轴标签.显示图表:最后,使用 plt.show()
方法显示图表.
其他图形类型
除了折线图,我们还可以绘制其他类型的图形.以下是一些常见的图形类型:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/65101.html
柱状图
# 绘制柱状图
plt.figure(figsize=(10, 6))
plt.bar(df['月份'], df['销售额'], color='orange')
plt.title('每月销售额柱状图')
plt.xlabel('月份')
plt.ylabel('销售额(元)')
plt.xticks(rotation=45)
plt.grid(axis='y')
plt.tight_layout()
plt.show()
饼图
# 绘制饼图
plt.figure(figsize=(8, 8))
plt.pie(df['销售额'], labels=df['月份'], autopct='%1.1f%%', startangle=140)
plt.title('每月销售额占比')
plt.axis('equal') # 使饼图为圆形
plt.show()
这些代码展示了如何使用 Matplotlib
结合 Pandas
进行多样的数据可视化,使得不同的数据展示方式更加丰富.文章源自菜鸟学院-https://www.cainiaoxueyuan.com/bc/65101.html