python - 为什么 scipy.optimize.curve_fit 没有产生最适合我的点的线?
问题描述
我正在尝试为重复 RT 测量绘制多个数据集,并使用scipy.optimize.curve_fit
.
我的代码为每个数据集生成一条线,但不是最适合的三次根线。每个数据集都用颜色编码到其对应的最佳拟合线:
我尝试增加数据的数量级,因为我听说有时scipy.optimize.curve_fit
不喜欢非常小的数字,但这并没有改变。如果有人能指出我哪里出错了,我将非常感激:
import numpy as np
from scipy.optimize import curve_fit
import scipy.optimize as scpo
import matplotlib.pyplot as plt
files = [ '50mA30%set1.lvm','50mA30%set3.lvm', '50mA30%set4.lvm',
'50mA30%set5.lvm']
for file in files:
data = numpy.loadtxt(file)
current_YBCO = data[:,1]
voltage_YBCO = data[:,2]
current_thermometer = data[:,3]
voltage_thermometer = data[:,4]
T = data[:,5]
R = voltage_thermometer/current_thermometer
p = np.polyfit(R, T, 4)
T_fit = p[0]*R**4 + p[1]*R**3 + p[2]*R**2 + p[3]*R + p[4]
y = voltage_YBCO/current_YBCO
def test(T_fit, a, b, c):
return a * (T_fit+b)**(1/3) + c
param, param_cov = curve_fit(test, np.array(T_fit), np.array(y),
maxfev=100000)
ans = (param[0]*(np.array(T_fit)+param[1])**(1/3)+param[2])
plt.scatter(T_fit,y, 0.5)
plt.plot(T_fit, ans, '--', label ="optimized data")
plt.xlabel("YBCO temperature(K)")
plt.ylabel("Resistance of YBCO(Ohms)")
plt.xlim(97, 102)
plt.ylim(-.00025, 0.00015)
解决方案
有两件事让你更难做到这一点。
首先,numpy 数组的负数的立方根。如果你尝试这个,你会发现你没有得到你想要的结果:
x = np.array([-8, 0, 8])
x**(1/3) # array([nan, 0., 2.])
这意味着您的test
函数在任何时候获得负值时都会出现问题,并且您需要负值来创建曲线的左侧。相反,使用np.cbrt
x = np.array([-8, 0, 8])
np.cbrt(x) # array([-2., 0., 2.])
其次,你的功能是
def test(T_fit, a, b, c):
return a * (T_fit + b)**(1/3) + c
不幸的是,这看起来与您显示的图表不太一样。这使得优化很难找到“好的”拟合。我特别不喜欢这个功能的地方是
- 它垂直于
T_fit == b
。此时您的数据有明确的斜率 - 它在远离
T_fit = b
. 您的数据是水平的。
但是,有时可以通过为优化提供一个良好的起点来获得更“合理的拟合”。
你没有给我们任何代码来工作,这使得这变得更加困难。因此,通过说明,试试这个:
import matplotlib.pyplot as plt
import numpy as np
import scipy.optimize
fig, ax = plt.subplots(1)
# Generate some data which looks a bit like yours
x = np.linspace(95, 105, 1001)
y = 0.001 * (-0.5 + 1/(1 + np.exp((100-x)/0.5)) + 0.125 * np.random.rand(len(x)))
# A fitting function
def fit(x, a, b, c):
return a * np.cbrt((x + b)) + c
# Perform the fitting
param, param_cov = scipy.optimize.curve_fit(fit, x, y, p0=[0.004, -100, 0.001], maxfev=100000)
# Calculate the fitted data:
yf = fit(x, *param)
print(param)
# Plot data and the fitted curve
ax.plot(x, y, '.')
ax.plot(x, yf, '-')
现在,如果我运行这段代码,我会得到一个大致遵循数据的拟合。但是,如果我把最初的猜测排除在外,即通过调用来进行拟合
param, param_cov = scipy.optimize.curve_fit(fit, x, y, maxfev=100000)
那么合身就更糟了。原因是这curve_fit
将从最初的猜测开始[1, 1, 1]
。看起来大致正确的解决方案位于不同的山谷中[1, 1, 1]
,因此它不是找到的解决方案。换句话说,它只找到局部最小值,而不是全局最小值。
推荐阅读
- c++ - 如何在 C++ 中处理嵌套类型模板
- php - 元素在重新加载时变得不可见,然后在调整大小时再次可见
- kubernetes - 无法获取特定 k8s 节点上的指标
- javascript - Parcel Bundler 给出内容安全策略错误
- android - 播放我的 hls 流是冻结的 - 为什么会这样?
- spring-boot - mvnw:JHipster spring boot 应用程序的权限被拒绝
- python - 在进程之间共享队列字典?
- json - 如何为列表SwiftUI中的每个项目添加一个布尔变量
- ios - PickerView 没有从 Array 获取更新的值
- flask - 2021-02-16 10:43:57,123 应用程序中的错误:/ GET 异常?