使用 InterpolatedUnivariateSpline 和 interp1d 的结果略有不同
Slightly different result using InterpolatedUnivariateSpline and interp1d
我正在使用 interp1d to fit a cubic spline but ran into some memmory issues, so as per the following question I have switched to using InterpolatedUnivariateSpline。但是,我注意到结果函数之间存在一些(非常)小的差异。因此,我的问题是;
A. 造成差异的原因,据我所知,这与基础方法(使用或不使用 FITPACK)有关 answer .但是,基础数学应该不一样吗?
B. 是否可以使用 InterpolatedUnivariateSpline 重现 interp1d 结果(改变平滑样条曲线度或边界只会使两个图形更加不同)?
重现细微差异的最少代码:
from scipy.interpolate import interp1d
from scipy.interpolate import InterpolatedUnivariateSpline
import matplotlib.pyplot as plt
import matplotlib
import numpy
x = [916.03189697265634, 916.0718969726563, 916.11189697265627, 916.15189697265623, 916.1918969726562, 916.23189697265627, 916.27189697265624, 916.31189697265631, 916.35189697265628, 916.39189697265624, 916.4318969726562, 916.47189697265628, 916.51189697265625, 916.55189697265632, 916.59189697265629, 916.63189697265625, 916.67189697265621, 916.71189697265618]
y = [893483.0, 2185234.0, 3903053.0, 4264327.0, 3128900.0, 1374942.0, 554350.0, 442512.0, 414232.0, 403098.0, 413778.0, 264185.0, 363063.0, 473762.0, 452284.0, 526806.0, 461402.0, 424270.0]
newX = numpy.linspace(x[0],x[-1],2500*(x[-1]-x[0]))
f_interp1d = interp1d(x,y, kind='cubic')
f_Univariate = InterpolatedUnivariateSpline(x,y)
yINTER = f_interp1d(newX)
yUNIVAR = f_Univariate(newX)
fig = plt.figure()
ax = fig.add_subplot(111)
plt.plot(x,y,'b*')
plt.plot(newX,yINTER,'r--')
plt.plot(newX,yUNIVAR,'g--')
plt.legend(['Raw Data','Interp1d','Univariate Spline'],loc='best')
plt.show()
产生下图(看起来不错):
不过仔细一看,还是有区别的:
我发现主要区别在于 InterpolatedUnivariateSpline 尝试执行连续拟合,而 cubic interp1d 应用分段拟合。
我想出的唯一解决方案(目前)是确保两个函数仅使用 4 个数据点(围绕最高数据点),因为这两个函数将产生一个单一的解决方案(而不是一个单一的如果使用 5 个数据点,解决方案与两个部分解决方案)。
片段:
# Strip top point
maxInt = 0
for index,i in enumerate(y):
if i > maxInt:
maxInt = i
x_sub = x[y.index(maxInt)-2:y.index(maxInt)+2]
y_sub = y[y.index(maxInt)-2:y.index(maxInt)+2]
newX = numpy.linspace(x_sub[0],x_sub[-1],2500*(x_sub[-1]-x_sub[0]))
f_interp1d = interp1d(x_sub,y_sub, kind='cubic')
f_Univariate = InterpolatedUnivariateSpline(x_sub,y_sub)
yINTER = f_interp1d(newX)
yUNIVAR = f_Univariate(newX)
fig = plt.figure()
ax = fig.add_subplot(111)
plt.plot(x,y,'b*')
plt.plot(newX,yINTER,'r--')
plt.plot(newX,yUNIVAR,'g--')
plt.legend(['Raw Data','Interp1d','Univariate Spline'],loc='best')
plt.show()
这会产生以下图表(缩小):
特写显示这两个函数确实是'identical':
但是,我仍然希望有更好的方法来强制两个函数产生类似的行为。
我正在使用 interp1d to fit a cubic spline but ran into some memmory issues, so as per the following question I have switched to using InterpolatedUnivariateSpline。但是,我注意到结果函数之间存在一些(非常)小的差异。因此,我的问题是;
A. 造成差异的原因,据我所知,这与基础方法(使用或不使用 FITPACK)有关 answer .但是,基础数学应该不一样吗?
B. 是否可以使用 InterpolatedUnivariateSpline 重现 interp1d 结果(改变平滑样条曲线度或边界只会使两个图形更加不同)?
重现细微差异的最少代码:
from scipy.interpolate import interp1d
from scipy.interpolate import InterpolatedUnivariateSpline
import matplotlib.pyplot as plt
import matplotlib
import numpy
x = [916.03189697265634, 916.0718969726563, 916.11189697265627, 916.15189697265623, 916.1918969726562, 916.23189697265627, 916.27189697265624, 916.31189697265631, 916.35189697265628, 916.39189697265624, 916.4318969726562, 916.47189697265628, 916.51189697265625, 916.55189697265632, 916.59189697265629, 916.63189697265625, 916.67189697265621, 916.71189697265618]
y = [893483.0, 2185234.0, 3903053.0, 4264327.0, 3128900.0, 1374942.0, 554350.0, 442512.0, 414232.0, 403098.0, 413778.0, 264185.0, 363063.0, 473762.0, 452284.0, 526806.0, 461402.0, 424270.0]
newX = numpy.linspace(x[0],x[-1],2500*(x[-1]-x[0]))
f_interp1d = interp1d(x,y, kind='cubic')
f_Univariate = InterpolatedUnivariateSpline(x,y)
yINTER = f_interp1d(newX)
yUNIVAR = f_Univariate(newX)
fig = plt.figure()
ax = fig.add_subplot(111)
plt.plot(x,y,'b*')
plt.plot(newX,yINTER,'r--')
plt.plot(newX,yUNIVAR,'g--')
plt.legend(['Raw Data','Interp1d','Univariate Spline'],loc='best')
plt.show()
产生下图(看起来不错):
不过仔细一看,还是有区别的:
我发现主要区别在于 InterpolatedUnivariateSpline 尝试执行连续拟合,而 cubic interp1d 应用分段拟合。
我想出的唯一解决方案(目前)是确保两个函数仅使用 4 个数据点(围绕最高数据点),因为这两个函数将产生一个单一的解决方案(而不是一个单一的如果使用 5 个数据点,解决方案与两个部分解决方案)。
片段:
# Strip top point
maxInt = 0
for index,i in enumerate(y):
if i > maxInt:
maxInt = i
x_sub = x[y.index(maxInt)-2:y.index(maxInt)+2]
y_sub = y[y.index(maxInt)-2:y.index(maxInt)+2]
newX = numpy.linspace(x_sub[0],x_sub[-1],2500*(x_sub[-1]-x_sub[0]))
f_interp1d = interp1d(x_sub,y_sub, kind='cubic')
f_Univariate = InterpolatedUnivariateSpline(x_sub,y_sub)
yINTER = f_interp1d(newX)
yUNIVAR = f_Univariate(newX)
fig = plt.figure()
ax = fig.add_subplot(111)
plt.plot(x,y,'b*')
plt.plot(newX,yINTER,'r--')
plt.plot(newX,yUNIVAR,'g--')
plt.legend(['Raw Data','Interp1d','Univariate Spline'],loc='best')
plt.show()
这会产生以下图表(缩小):
特写显示这两个函数确实是'identical':
但是,我仍然希望有更好的方法来强制两个函数产生类似的行为。