import tensorflow as tf
weights = tf.constant([[1,2,3], [4,5,6]], dtype=tf.float32)
sess = tf.InteractiveSession()
# 計算的是所有元素的平方和再除以2
print(tf.nn.l2_loss(weights).eval()())
# 等價於
print(tf.contrib.layers.l2_regularizer(1.)(weights).eval())
# output: 45.5
接下來將介紹兩種方法將l2正則化項添加到損失函數後:
壹、遍歷trainable variables添加L2正則化項:
1.遍歷可訓練參數,將每個參數傳入tf.nn.l2_loss()進行計算並相加起來;
2.乘以weight_decay並與base_loss相加。
weight_decay = 0.001
base_loss = tf.reduce_mean(tf.nn.sparse_softmax_cross_entropy_with_logits(labels=labels, logits=logits))
l2_loss = weight_decay * tf.add_n([tf.nn.l2_loss(tf.cast(v, tf.float32)) for v in tf.trainable_variables()])
loss = base_loss + l2_loss
註意:該過程對每個trainable variable都進行了l2正則化,包括權值w和偏置b。有種說法是如果對偏執b進行l2正則化將會導致欠擬合,壹般只需要對權值w進行正則化,所以來看第二種方法。
二、在構造網絡層時傳入l2正則化函數:
如下所示,在構造網絡層時,將'kernel_initializer'參數設為l2正則化函數,則tensorflow會將該權重變量(卷積核)的l2正則化項加入到集合 tf.GraphKeys.REGULARIZATOIN_LOSSES裏。
x = tf.layers.conv2d(x, 512, (3, 3),
padding='same',
activation=tf.nn.relu,
kernel_initializer=tf.truncated_normal_initializer(stddev=0.01),
kernel_regularizer=tf.contrib.layers.l2_regularizer(0.001)
在計算loss時使用tf.get_collection()來獲取tf.GraphKeys.REGULARIZATOIN_LOSSES集合,然後相加即可:
base_loss = tf.reduce_mean(tf.nn.sparse_softmax_cross_entropy_with_logits(labels=labels, logits=logits))
l2_loss = tf.get_collection(tf.GraphKeys.REGULARIZATION_LOSSES)
loss = tf.add_n([base_loss] + l2_loss, name="loss")
歡迎補充指正。