首先引入三件套和scipy
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.optimize import curve_fit
拿到实验数据,通过pandas读取为DataFrame
data = pd.read_csv("W-900K.csv")
data.head()
|
ind |
val |
---|
0 |
0.0 |
899.56250 |
---|
1 |
0.1 |
932.16851 |
---|
2 |
0.2 |
977.79814 |
---|
3 |
0.3 |
1029.72737 |
---|
4 |
0.4 |
1131.46345 |
---|
将数据绘制出来,以方便确认使用哪种方程进行拟合
plot1=plt.plot(data['ind'], data['val'], '*',label='original values')
plt.xlabel('x')
plt.ylabel('y')
plt.legend(loc=4)
plt.title('ORIGIN VALUES')
plt.show()
从上图曲线可以推断出,我们的数据应该符合指数分布,所以下面定义一个指数函数,将参数使用a,b,c预留出来.
def func(x,a,b,c):
return a*np.exp(b*x) + c
进行拟合,得出上一步定义的参数, popt中得出的三个值分别代表上述函数中的三个参数 a,b,c
popt, pcov = curve_fit(func, data['ind'], data['val'])
print(popt)
[-443.68006622 -2.49480416 1293.98737632]
至此我们的求解已经结束,下面用得到的结果绘制出函数曲线以验证结果的正确性
# 原始数据
plt.plot(data['ind'], data['val'], '*',label='original values')
# 拟合出的数据
plt.plot(data['ind'], func(data['ind'],popt[0],popt[1],popt[2]), 'r',label='curve fit values')
plt.xlabel('x')
plt.ylabel('y')
plt.legend(loc=4)
plt.title('COMPARISON')
plt.show()