首页 > 解决方案 > 使用curve_fit估计不同大小数据集的常见模型参数

问题描述

我正在研究一个曲线拟合问题,我打算在多个大小不等的数据集上全局估计共享模型参数。我从下面链接中的代码开始工作,其中线性回归 y = a*x + b 的常见 a 参数是在三个不同的 y 向量和一个共同的 x 向量上估计的。如何使用 scipy.optimize 中的 curve_fit 和跨多个数据集的共享拟合参数?

我设法使代码示例适应更一般的情况,使用三个不同的 x 向量,一个对应于每个 y 数据向量。但是,当我想进一步扩展它以使其也适用于大小不等的数据集时,我遇到了以下错误:“ValueError: setting an array element with a sequence.”。

请在下面找到代码示例。非常感谢任何帮助!

干杯

import matplotlib.pyplot as plt
import numpy as np
from scipy.optimize import curve_fit

x = [[0, 1, 2, 3],
[0.2, 1.2, 2.2, 3.2],
[0.3, 1.3, 2.3]]

y = [[-0.80216234,  1.41125365,  1.42565202,  2.42567754],
[ 1.34166743,  1.29731851,  2.98374731,  3.32110875],
[ 1.71398203,  3.29737756,  3.81456949]]

x = np.array(x)
y = np.array(y)


def f(x, a, b):
    return a * x + b


def g(x, a, b_1, b_2, b_3):
     return np.concatenate((f(x[0], a, b_1), f(x[1], a, b_2), f(x[2], a, b_3)))

(a, *b), _ = curve_fit(g, x, y.ravel())

for x_i, y_i, b_i in zip(x, y, b):
    plt.plot(x_i, f(x_i, a, b_i), label=f"{a:.1f}x{b_i:+.1f}")
    plt.plot(x_i, y_i, linestyle="", marker="x",  color=plt.gca().lines[-1].get_color())
plt.legend()
plt.show()

有关具有多个相同大小的 x 向量的工作示例的代码,请参见下文:

import matplotlib.pyplot as plt
import numpy as np
from scipy.optimize import curve_fit

x = [[0, 1, 2, 3],
 [0.2, 1.2, 2.2, 3.2],
 [0.3, 1.3, 2.3, 3.3]]

y = [[-0.80216234,  1.41125365,  1.42565202,  2.42567754],
 [ 1.34166743,  1.29731851,  2.98374731,  3.32110875],
 [ 1.71398203,  3.29737756,  3.81456949, 4.25]]

x = np.array(x)
y = np.array(y)


def f(x, a, b):
    return a * x + b


def g(x, a, b_1, b_2, b_3):
    return np.concatenate((f(x[0], a, b_1), f(x[1], a, b_2),     f(x[2], a, b_3)))

(a, *b), _ = curve_fit(g, x, y.ravel())

for x_i, y_i, b_i in zip(x, y, b):
   plt.plot(x_i, f(x_i, a, b_i), label=f"{a:.1f}x{b_i:+.1f}")
   plt.plot(x_i, y_i, linestyle="", marker="x",     color=plt.gca().lines[-1].get_color())

plt.legend()
plt.show()

标签: pythonarraysnumpycurve-fitting

解决方案


问题是你不能numpy.array从一个参差不齐的列表中创建一个。要重铸为np.array所有维度必须匹配,即您不能有一个空条目,因为这对 Numpy 没有意义。

在您的情况下,您还没有为数组中的一定义一个条目(即,当其他行有 4 个条目时,最后一行中有 3 个条目)。Numpy 根本不会让你这样做,因为它是一个数值包,它依赖于矩形明确定义的数组来进行计算。


推荐阅读