代码有很多种,都可以。对于复杂的数据预测精度都很低
逻辑回归中可以更改数据类型为我们的数据类型使用即可,这里写入的数据一共有6组,找到部分数据将其作为训练矩阵,根据我们的需要更改即可
代码段1: 训练出来的theta值就是我们需要的值
clear
clc
X = xlsread(‘C:\Users\user01\Desktop\test.xlsx’);
[m,n] = size(X);
%数据归一化处理
X(:,1)=X(:,1)/max(X(:,1));
X(:,2)=X(:,2)/max(X(:,2));
X(:,3)=X(:,3)/max(X(:,3));
X(:,4)=X(:,4)/max(X(:,4));
X(:,5)=X(:,5)/max(X(:,5));
X(:,6)=X(:,6)/max(X(:,6));
%将截距项添加至数据集X
%X=[X,ones(m,1)];
Y=X(:,7);
%我们把数据集中所有序号末位为6的设定为测试集,其他的数据为训练集
%将数据分为训练集XX1,YY1,测试集XX2,YY2。
j=1;
k=1;
for i=1:m
if mod(i,10)==9
XX2(j,:)=X(i,:);
YY2(j,:)=Y(i,:);
j=j+1;
else
XX1(k,:)=X(i,:);
YY1(k,:)=Y(i,:);
k=k+1;
end
end
[m1,n1] = size(XX1);
[m2,n2] = size(XX2);
%设定学习率为0.01
delta=0.01;
%收敛到的极值是否与初值无关还待验证
theta1=rand(6,1);
%训练模型
%向量化求解theta
%迭代次数num
% num = 100;
% while(num)
% xx = XX1(:,1:4)’;
% yy = YY1;
% A = xx’ * theta1;
% g = 1/(1+exp(-A));
% E = g’ - yy;
% theta2 = theta1 - delta * xx * E;
%
% % temp = theta2-theta1;
% % theta = norm(temp);
% theta1 = theta2;
% num = num - 1;
% end
%%训练模型
%公式法求解theta
num = 100;
while(num)
dt=zeros(6,1);
for i=1:m1
xx=XX1(i,1:6)’;
yy=YY1(i,1);
h=1/(1+exp(-(theta1’ * xx)));
dt=dt+(yy-h) * xx;
end
%theta2=theta1+delta*dt; theta2=theta1 - 1/m1*delta*dt; %norm(theta2-theta1) %0.00001 %norm(A) 返回向量A的2范数 temp = theta2-theta1; theta = norm(temp); theta1=theta2; num = num - 1;
end
%测试数据
cc=0;
for i=1:m2
xx=XX2(i,1:6)’;
yy=YY2(i);
ans=1/(1+exp(-theta2’ * xx));
if ans>0.5 && yy==1
cc=cc+1;
end
if ans<=0.5 && yy==0
cc=cc+1;
end
end
cc/m2
%测试结果: 正确率为 75.73%。