如何绘制多个 pandas 列

How to plot multiple pandas columns

我有数据框 total_year,其中包含三列(yearactioncomedy)。

total_year

我想在 x 轴上绘制 year 列,在 y 轴上绘制 actioncomedy

如何在 y 轴上绘制两列(actioncomedy)?

我的代码只在 y 轴上绘制一列。

total_year[-15:].plot(x='year', y='action', figsize=(10,5), grid=True)

Pandas.DataFrame.plot() 默认使用索引绘制 X 轴,所有其他 numeric 列将用作 Y 值。

所以将 year 列设置为索引就可以了:

total_year.set_index('year').plot(figsize=(10,5), grid=True)

可以向 pandas 绘图函数的 y 参数提供多个列名称。这些应该在 list 中指定,如下所示。

df.plot(x="year", y=["action", "comedy"])

完整示例:

import matplotlib.pyplot as plt
import pandas as pd

df = pd.DataFrame({"year": [1914,1915,1916,1919,1920],
                   "action" : [2.6,3.4,3.25,2.8,1.75],
                   "comedy" : [2.5,2.9,3.0,3.3,3.4] })
df.plot(x="year", y=["action", "comedy"])
plt.show()

  • 使用pandas.DataFrame.plot时,只需在x参数中指定一列即可。
    • 需要注意的是,具有 numeric 值的其余列将用于 y
    • 以下代码包含用于演示的额外列。请注意,'date' 保留为 string。但是,如果 'date' 转换为 datetime dtype,绘图 API 也会在 y 轴上绘制 'date' 列。
  • 如果数据框包含许多列,其中一些不应绘制,则指定 y 参数,如此 所示,但如果数据框仅包含要绘制的列,然后仅指定 x 参数。
  • 如果索引被用作x轴,则不需要指定x=
import pandas as pd

# test data
data = {'year': [1914, 1915, 1916, 1919, 1920],
        'action': [2.67, 3.43, 3.26, 2.82, 1.75],
        'comedy': [2.53, 2.93, 3.02, 3.37, 3.45],
        'test1': ['a', 'b', 'c', 'd', 'e'],
        'date': ['1914-01-01', '1915-01-01', '1916-01-01', '1919-01-01', '1920-01-01']}

# create the dataframe
df = pd.DataFrame(data)

# display(df)
   year  action  comedy test1        date
0  1914    2.67    2.53     a  1914-01-01
1  1915    3.43    2.93     b  1915-01-01
2  1916    3.26    3.02     c  1916-01-01
3  1919    2.82    3.37     d  1919-01-01
4  1920    1.75    3.45     e  1920-01-01

# plot the dataframe
df.plot(x='year', figsize=(10, 5), grid=True)