%2015.04.26 Kang Yongxin ----v 2.0
%完成作业中BP算法,采用批量方式更新权重
%%
%输入数据格式
%x 矩阵 : 样本个数*特征维度
%y 矩阵 :样本个数*类别个数(用01000形式表示)
close all;
clear all;
clc ;
load data.mat;%
x_test=x(1:3:30,:);%从原始数据中留出一部分 作为测试样本
y_test=y(1:3:30,:);
x_train=[x(2:3:30,:);x(3:3:30,:)];%x(1:2:30,:);%[x(11:25,:);x(26:30,:);x(1:10,:)];
y_train=[y(2:3:30,:);y(3:3:30,:)];%%[y(11:25,:);y(26:30,:);y(1:10,:)];
%%
%定义变量名称,初始化网络
d=size(x_train,2);%特征维度,也是输入层节点个数
num_trains=size(x_train,1);%训练样本个数
n_class=size(y_train,2);%样本类别数
node_layer=[d 4 n_class];%每层的节点个数 %[d 3 5 n_class];%构建更多层的网络
num_layer=size(node_layer,2)-1;%网络层数
for i=1:1:num_layer-1
f_name{i}=‘sigmoid‘;%对应每层的激活函数
end
f_name{num_layer}=‘tanh‘;%‘sigmoid‘;%最后一层的激活函数
eta=0.08;%学习率
theta=10e-4;%终止条件
W=cell(num_layer,1);%初始化权重矩阵,都设曾1,
for i=1:1:num_layer
W{i}=rand(node_layer(i),node_layer(i+1));
end
W_init=W;
%开始循环
item=1;
while item>0 && item<1500
%%
%初始化权值增量
for layer=1:1:num_layer
delta_sum{layer}=zeros(size(W{layer})) ;
end
%%
for k=1:1:num_trains
%对于每个样本的循环
%%%%%%%%%%%%%%%%%%%
%前向计算
x_in=x_train(k,:);
for layer=1:1:num_layer
%对于每一层进行前向计算,并且保存输出值y_out
y_out{layer}=forward(x_in,W{layer},f_name{layer});%批量更新时候W要跟随外层循环
x_in=y_out{layer};
end
%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%
%反向传播,最后一层要单算,因为只有一个输出
delta_out{layer}=y_train(k,:)-y_out{layer};%输出与真值的差
J(k)=0.5*sum(delta_out{layer}.^2);%均方误
delta_error{layer}=delta_out{layer}.*d_function(y_out{layer},f_name{num_layer});%从指向节点收集到的误差
delta_w{layer}=eta*(y_out{layer-1})‘*delta_error{layer};%本层的权重变化量
while layer>1
%反向传播误差,保存delta_w
layer=layer-1;
delta_error{layer}=delta_error{layer+1}*(W{layer+1})‘.*d_function(y_out{layer},f_name{layer});%从指向节点收集到的误差并使用之前的权重进行加权
if layer~=1
%如果没到第一层,就用layer-1层的输出作为输入
delta_w{layer}=eta*(y_out{layer-1})‘*delta_error{layer};%本层的权重变化量
else
%如果是第一层就用本次训练的x作为输入
delta_w{layer}=eta*(x_train(k,:))‘*delta_error{layer};%本层的权重变化量
end
end
%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%
%批量更新,要对所有样的贡献进行加和
for layer=1:1:num_layer
delta_sum{layer}=delta_sum{layer}+delta_w{layer} ;
end
end%k个样本对权重 变化量的贡献计算完毕
%%
figure(1);
JW(item)=sum(J);
if item>10
Delta_JW=abs(JW(item)-JW(item-1));
if Delta_JW<theta
break;%循环终止条件
end
end
plot(item,JW(item),‘.‘)
hold on;
item=item+1;
%更新权重
for layer=1:1:num_layer
%对于每一层更新权重,这个更新放的位置决定是进行批量更新还是每次更新
W{layer}=W{layer}+delta_sum{layer};%批量更新
end
end
%%
%计算准确率
x_in=x_test;
for layer=1:1:num_layer
%对于每一层进行前向计算,并且保存输出值y_out
y_out{layer}=forward(x_in,W{layer},f_name{layer});%批量更新时候W要跟随外层循环
x_in=y_out{layer};
end
[C,I]=max(y_out{layer},[],2);
[C,I_true]=max(y_test,[],2);
Trues=find((I-I_true)==0);
Precision=size(Trues,1)/size(y_test,1)
function [ y ] = forward( x,w,f_name )
%FORWARD 前向计算得到输出值
% 输入 x:输入向量1*m
% w:权重矩阵m*n
% f_name:函数名称(暂时支持‘sigmoid‘‘tanh‘)
% 输出 y:输出向量1*n 公式为 y=f(x*w)
if strcmp(f_name,‘sigmoid‘)
y=sigmoid(x*w);
else if strcmp(f_name,‘tanh‘)
y=tanh(x*w);%matlab 自带
else
disp(‘wrong function name ‘);
end
end
end
function [d_f ] = d_function( y,f_name )
%D_FOUNCTION 对相关函数进行求导数
% 输入是该层的输出值y
if strcmp(f_name,‘sigmoid‘)
d_f=y.*(1-y);
else if strcmp(f_name,‘tanh‘)
d_f=1-y.^2;%matlab 自带
else
disp(‘wrong function name at d_function‘);
end
end
end
function [ y ] = sigmoid( x ) %MY_SIGMOID % 输入向量x,输出 y=1./(1+exp(-x)); end
原文:http://www.cnblogs.com/simayuhe/p/5437083.html