首页 > 解决方案 > 使用 scipy.optimize.curve_fit 的指数拟合没有很好的猜测

问题描述

我想找到一个描述下面数据的模型。

x = array([50000.,  100000.,  150000.,  200000.,  250000.,  300000.,
    350000.,  400000.,  450000.,  500000.,  550000.,  600000.,
    650000.,  700000.,  750000.,  800000.,  850000.,  900000.,
    950000., 1000000.])
y = array([1.87792730e-06, 3.81015841e-07, 1.89900422e-07, 1.21302069e-07,
   8.39703240e-08, 6.18937868e-08, 4.98975718e-08, 3.97720839e-08,
   3.23420144e-08, 2.79493666e-08, 2.35548293e-08, 2.01505953e-08,
   1.81079429e-08, 1.59391671e-08, 1.37227044e-08, 1.30031234e-08,
   1.19076952e-08, 1.10967303e-08, 9.43339053e-09, 8.98627485e-09])

查看数据点的分布,预计数据遵循指数函数。因此,我尝试按以下方式使用 scipy.optimize.curve_fit。

from scipy.optimize import curve_fit
import numpy as np
from matplotlib import pyplot as plt 

def f(x, a, b, c): 
    return a*np.exp(b*x)+c

curve_fit(f, x, y, p0=[np.min(y), -1, np.min(y)])

这并没有给我任何合理的 a、b 和 c 值。我尝试使用几个 p0 设置,但 pcov 矩阵总是只包含 inf。

如果您有数据但对这种情况下的参数没有很好的猜测,您如何实现合理的拟合?

标签: pythoncurve-fitting

解决方案


有一种简单的方法(无需初始猜测,无需迭代演算),其原理在论文中进行了解释:https ://fr.scribd.com/doc/14674814/Regressions-et-equations-integrales

由于积分方程,非线性回归转换为线性回归。您的问题和数值演算的应用如下所示。

请注意,拟合的标准(最小均方)并不完全针对给定数据,而是针对具有积分数值演算的变换数据(下面记为 S)。因此,如果结果的准确性不够,则需要进行非线性回归。开始迭代过程的初始值可以是已经找到的离目标不远的值。

所以,我认为这回答了你关于寻找初始猜测的问题。

在此处输入图像描述

您的数据的数值示例:

在此处输入图像描述

在此处输入图像描述

注意:对于 Y 的高值,结果非常好。但对于 Y 的最小值,结果并不准确。根据拟合标准,可能需要使用非线性回归进行后处理。

注意:在您的数据示例中,微积分涉及非常高和非常低的指数。建议对原始数据应用方便的因子,以便以通常的数量级对其进行绑定。上面的微积分示例没有这样做,以使其更易于理解。

有关信息:

允许线性回归的积分方程是:

在此处输入图像描述


推荐阅读