改变 xticks matplotlib

Alter xticks matplotlib

我有一个散点图 x-axis

import pandas as pd
import matplotlib.pyplot as plt
from matplotlib import ticker

d = ({
    'A' : ['08:00:00','08:10:00','08:12:00','08:26:00','08:29:00','08:31:00','10:10:00','10:25:00','10:29:00','10:31:00'],
    'B' : ['1','1','1','2','2','2','7','7','7','7'],     
    'C' : ['X','Y','Z','X','Y','Z','A','X','Y','Z'],
    })

df = pd.DataFrame(data=d)

fig,ax = plt.subplots()

x = df['A']
y = df['B']

x_numbers = (pd.to_timedelta(df['A']).dt.total_seconds())

plt.scatter(x_numbers, y)
plt.show()

输出 1:

我想将总秒数换成实际时间戳,所以我包括:

plt.xticks(x_numbers, x)

这导致 x 刻度相互重叠。

如果我使用:

plt.locator_params(axis='x', nbins=10) 

结果同上。如果我将 nbins 更改为更小的值,刻度不会重叠,但它们不会与各自的散点对齐。由于散点不符合正确的时间戳。

如果我使用:

M = 10
xticks = ticker.MaxNLocator(M)
ax.xaxis.set_major_locator(xticks) 

ticks不重叠但不对齐各自的散点。

是否可以选择您使用的 x-ticks 个数,但仍与相应的数据点对齐。

例如对于下面的 figure。我可以只使用 nticks 而不是全部吗?

输出 2:

首先,时间间隔不一致。 其次是高频系列

在一般情况下,您不需要匹配每个条目对应的xticks。而且,在这些情况下,您可以利用 plt.plot_date(x, y) 以及 tick locatorsformatters 之类的东西,例如 DayLocator()DateFormatter('%Y-%m-%d').

虽然对于这种非常特殊的情况,其中数据处于分钟级别并且很少有点非常接近,但破解方法可能是尝试使用您用于 x 轴的数字系列,x_numbers。为了增加两点之间的差距,我尝试了 cumsum() 并在一定程度上消除了重叠,给了一些 rotationxticks

fig, ax = plt.subplots(figsize=(10,6))

x = df['A']
y = df['B']

x_numbers = (pd.to_timedelta(df['A']).dt.total_seconds()).cumsum()

plt.scatter(x_numbers, y)
plt.xticks(x_numbers, x, rotation=50)
plt.show()

让我们使用一些 xticklabel 操作:

d = ({
    'A' : ['08:00:00','08:10:00','08:12:00','08:26:00','08:29:00','08:31:00','10:10:00','10:25:00','10:29:00','10:31:00'],
    'B' : ['1','1','1','2','2','2','7','7','7','7'],     
    'C' : ['X','Y','Z','X','Y','Z','A','X','Y','Z'],
    })

df = pd.DataFrame(data=d)

fig,ax = plt.subplots()

x = df['A']
y = df['B']

x_numbers = (pd.to_timedelta(df['A']).dt.total_seconds())

plt.scatter(x_numbers, y)
loc, labels = plt.xticks()
newlabels = [str(pd.Timedelta(str(i)+ ' seconds')).split()[2] for i in loc]
plt.xticks(loc, newlabels)
plt.show()

输出: