神经网络的前向传播

该神经网络为三层：输入层（2个结点），隐藏层（3个结点），输出层（1个结点）各一层。不采用激活函数，也不考虑偏置项。

w1 = tf.Variable(tf.random_normal([2, 3], stddev=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1))

#设置占位符，在run的时候通过指定feed_dict参数直接给出输入的数据
x = tf.placeholder(tf.float32, shape=(1, 2), name="input")

a = tf.matmul(x, w1)#matmul为两个矩阵的乘法运算
y = tf.matmul(a, w2)

with tf.Session():
    #初始化参数
    init_op = tf.global_variables_initializer()
    sess.run(init_op)
    
    #完成前向的运算，feed_dict参数指定输入的数据，x可以为多个数据，由此产生多个输出
    #例如：feed_dict={x:[0.1, 0.2], [0.5, 0.8],...},占位符设置时shape要跟着改变
    print(sess.run(y, feed_dict={x: [0.7, 0.9]}))

对输出的y通过sigmoid函数转化为概率

对于二分问题，我们可以只输出一个值，表示为正样本的概率，也可以输出两个值：[0, 1]和[1, 0]来表示两个分类。对于只输出一个值的情况，我们通常对输出y用sigmoid函数转化为概率表示：

y = tf.sigmoid(y)

定义损失函数

#这里采用的是比较常用的交叉熵误差作为损失函数
cross_entropy = -tf.reduce_mean(#reduce_mean对多组数据的误差和取均值
    #tf.clip_by_value(y, 1e-10, 1.0)对y的取值进行裁剪，小于1e-10取1e-10，大于1.0取1.0，保证log能算
    y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)
    + (1-y)*tf.log(tf.clip_by_value(1-y, 1e-10, 1.0)))

定义学习率并采用优化算法

learning_rate = 0.001#学习率设置为0.001
#采用AdamOptimizer优化算法，以学习率learning_rate去优化损失函数cross_entropy
train_step = tf.train.AdamOptimizer(learning_rate).minimize(cross_entropy)

完整的神经网络样例程序

import tensorflow as tf
from numpy.random import RandomState

#每8个样本更新一轮参数
batch_size = 8

#参数初始化
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))

#前向的计算
x = tf.placeholder(tf.float32, shape=(None, 2), name="x-input")
y = tf.placeholder(tf.float32, shape=(None, 1), name="y-input")

a = tf.matmul(x, w1)
y = tf.matmul(a, w2)

y = tf.sigmoid(y)

#选择损失函数，学习率，优化算法
cross_entropy = -tf.reduce_mean(
    y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)
    + (1-y)*tf.log(tf.clip_by_value(1-y, 1e-10, 1.0)))
train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)

#自己构建一个数据集，并自动产生标签
rdm = RandomState(1)#产生一个随机数种子
dataset_size = 128#数据集有128条数据
X = rdm.rand(dataset_size, 2)
Y = [[int(x1+x2 <1)] for (x1, x2) in X]#按这个规则自动产生label
    

with tf.Session() as sess:
    #初始化参数
    init_op = tf.global_variables_initializer()
    sess.run(init_op)
    
    STEPS = 5000#训练5000轮
    for i in range(STEPS):
        start = (i * batch_size) % data_size
        end = min(start+batch_size, dataset_size)
        sess.run(train_step, feed_dict={x: X[start:end], y_: Y[start:end]})
        if i % 1000 == 0:#每1000轮输出一次，整个样本的交叉熵误差
            total_cross_entropy = sess.run(cross_entropy, feed_dict={x: X, y_: Y})
            print("After %d training step(s), cross entropy on all data is %g" % (i,                            total_cross_entropy))
    #查看训练完后的两个参数矩阵
    print(sess.run(w1))
    print(sess.run(w2))