1°提取问题中实体的特征向量作为神经网络的输入;
2°定义神经网络的结构,并定义如何从神经网络的输入得到输出;(即前向传播算法)
3°通过训练数据来调整神经网络中参数的取值,这就是训练神经网络的过程;
4°使用训练好的神经网络来预测未知的数据。(类似步骤2°)
1°定义神经网络的结构和前向传播的输出结果;
2°定义损失函数以及选择反向传播优化的算法;
3°生成会话,并在训练集上反复运行反向传播优化算法。
训练神经网络全过程
1°定义神经网络结构前向传播的预测值
组成部分提取:
数据集大小:batch_size=8
神经网络参数:w1[2,3],w2[3,1]
两个输入节点:x
一个输出节点:y_ (正确结果)
import tensorflow as tf
#通过Numpy工具包生成模拟训练集
from numpy.random import RandomState
#训练集大小
batch_size = 8
#定义神经网络参数
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))
#两个输入节点
x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input')
#一个输出节点
y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input')
前向传播获取预测值
预测值:y
#前向传播
a = tf.matmul(x, w1)
y = tf.matmul(a, w2)
2°定义损失函数和反向传播算法
损失函数:cross_entropy
优化方法:train_step
#cross_entropy损失函数:定义了真实值和预测值之间的交叉熵。
cross_entropy = -tf.reduce_mean( #把所有数加起来取平均
y_ *tf.log(tf.clip_by_value(y, 1e-10, 1.0)))
train_step = tf.train.AdadeltaOptimizer(0.001).minimize(cross_entropy)
#train_step反向传播优化方法。学习率为0.01
3°生成会话,并在训练集上反复运行反向传播优化算法
模拟数据集:X
样本标签:Y
#随机生成模拟数据集
rdm = RandomState(1)
dataset_size = 128
X = rdm.rand(dataset_size, 2)#128行 2列
#定义规则给出样本标签
Y = [[int(x1+x2 < 1)] for (x1, x2) in X]
'''
设置回归的正确值为两个输入的和加上一个随机量。
之所以要加上一个随机量是为了加入不可预测的噪音,否则不同#损失函数的意义就不大了
,因为不同损失函数都会在能完全预测正确的时候最低。
一般来说噪音为一个均值为0的小#量,所以这里的噪音设置为-0.05 ~ 0.05的随机数
'''
#创建会话
with tf.Session() as sess:
init_op = tf.initialize_all_variables()
sess.run(init_op)
print("w1", sess.run(w1))
print("w2", sess.run(w2))
#设定训练的轮数
STEPS = 5000
for i in range(STEPS):
#每次选取batch_size个样本进行训练
start = (i * batch_size) % dataset_size
end = min(start+batch_size, dataset_size)
#通过选取样本训练神经网络并更新参数
sess.run(train_step,
feed_dict={x: X[start:end], y_: Y[start:end]})
if i % 1000 == 0:
#每隔一段时间计算在所有数据上的交叉熵并输出
total_cross_entropy = sess.run(
cross_entropy, feed_dict={x:X, y_:Y})
print("After %d trainingstep(s),cross entropy on all data is %g" % (i, total_cross_entropy))
#查看训练之后神经网络参数的值
print("ww1", sess.run(w1))
print("ww2", sess.run(w2))
因篇幅问题不能全部显示,请点此查看更多更全内容