原文: https://machinelearningmastery.com/custom-metrics-deep-learning-keras-python/
Keras 库提供了一种在训练深度学习模型时的计算方法和报告一系列标准指标的方法。
除了为分类和回归问题提供标准指标外,Keras 还允许您在训练深度学习模型时定义和报告您自己的自定义指标。当您想要在训练期间更好地获取模型函数的表现度量时,这将特别有用。
在本教程中,您将了解如何使用内置指标以及如何在 Keras 中训练深度学习模型时定义和使用您自己的指标。
完成本教程后,您将了解:
- Keras 指标的工作原理以及在训练模型时如何使用它们。
- 通过实例了解如何使用 Keras 中的回归和分类指标。
- 通过实例如何在 Keras 中定义和使用您自己的自定义指标。
让我们开始吧。
度量标准以及如何在 Python 中使用 Keras 进行深度学习的自定义度量标准 Indi Samarajiva 的照片,保留一些权利。
本教程分为 4 个部分;他们是:
- Keras 指标
- Keras 回归指标
- Keras 分类指标
- Keras 的自定义指标
Keras 允许您列出在模型训练期间要监控的指标。
您可以通过指定“metrics
”参数并为模型上的compile()
函数提供函数名称列表(或函数名称别名)来完成此操作。
例如:
model.compile(..., metrics=['mse'])
您列出的特定指标可以是 Keras 函数的名称(如mean_squared_error
)或这些函数的字符串别名(如'mse
')。
度量值记录在训练数据集的每个迭代的末尾。如果还提供了验证数据集,则还会记录为验证数据集计算的度量指标。
所有度量都以详细输出和从调用fit()
函数返回的历史对象中报告。在这两种情况下,度量函数的名称都用作度量值的键。对于验证数据集的度量标准,将“val_
”前缀添加到密钥。
损失函数和明确定义的 Keras 指标都可用作训练指标。
以下是您可以在 Keras 中用于回归问题的指标列表。
- 均方差:mean_squared_error,MSE 或 mse
- 平均绝对误差:mean_absolute_error,MAE,mae
- 均匀绝对百分比误差:mean_absolute_percentage_error,MAPE,mape
- 余弦近似 :cosine_proximity,cosine
下面的示例演示了一个简单的人为回归问题中的 4 个内置回归指标。
from numpy import array
from keras.models import Sequential
from keras.layers import Dense
from matplotlib import pyplot
# prepare sequence
X = array([0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0])
# create model
model = Sequential()
model.add(Dense(2, input_dim=1))
model.add(Dense(1))
model.compile(loss='mse', optimizer='adam', metrics=['mse', 'mae', 'mape', 'cosine'])
# train model
history = model.fit(X, X, epochs=500, batch_size=len(X), verbose=2)
# plot metrics
pyplot.plot(history.history['mean_squared_error'])
pyplot.plot(history.history['mean_absolute_error'])
pyplot.plot(history.history['mean_absolute_percentage_error'])
pyplot.plot(history.history['cosine_proximity'])
pyplot.show()
运行该示例将在每次迭代结束后打印度量标准值。
...
Epoch 96/100
0s - loss: 1.0596e-04 - mean_squared_error: 1.0596e-04 - mean_absolute_error: 0.0088 - mean_absolute_percentage_error: 3.5611 - cosine_proximity: -1.0000e+00
Epoch 97/100
0s - loss: 1.0354e-04 - mean_squared_error: 1.0354e-04 - mean_absolute_error: 0.0087 - mean_absolute_percentage_error: 3.5178 - cosine_proximity: -1.0000e+00
Epoch 98/100
0s - loss: 1.0116e-04 - mean_squared_error: 1.0116e-04 - mean_absolute_error: 0.0086 - mean_absolute_percentage_error: 3.4738 - cosine_proximity: -1.0000e+00
Epoch 99/100
0s - loss: 9.8820e-05 - mean_squared_error: 9.8820e-05 - mean_absolute_error: 0.0085 - mean_absolute_percentage_error: 3.4294 - cosine_proximity: -1.0000e+00
Epoch 100/100
0s - loss: 9.6515e-05 - mean_squared_error: 9.6515e-05 - mean_absolute_error: 0.0084 - mean_absolute_percentage_error: 3.3847 - cosine_proximity: -1.0000e+00
然后创建训练时期上的 4 个度量的线图。
用于回归的内置 Keras 度量的线图
注意,使用字符串别名值指定度量['mse
','mae
','mape
','cosine
' ]并使用其扩展函数名称作为历史对象上的键值引用。
我们还可以使用其扩展名称指定指标,如下所示:
model.compile(loss='mse', optimizer='adam', metrics=['mean_squared_error', 'mean_absolute_error', 'mean_absolute_percentage_error', 'cosine_proximity'])
如果将函数名称导入脚本,我们也可以直接指定它们。
from keras import metrics
model.compile(loss='mse', optimizer='adam', metrics=[metrics.mean_squared_error, metrics.mean_absolute_error, metrics.mean_absolute_percentage_error, metrics.cosine_proximity])
您还可以将损失函数用作指标。
例如,您可以使用均方对数误差(mean_squared_logarithmic_error
,MSLE
或msle
)损失函数作为度量,如下所示:
model.compile(loss='mse', optimizer='adam', metrics=['msle'])
以下是您可以在 Keras 中用于分类问题的指标列表。
- 二进制准确度:binary_accuracy,acc
- 分类准确度:categorical_accuracy,acc
- 稀疏分类准确度:sparse_categorical_accuracy
- 前 k 个分类准确度:top_k_categorical_accuracy(要求你指定一个 k 参数)
- 稀疏顶部 k 分类精度:sparse_top_k_categorical_accuracy(需要指定 k 参数)
准确度是具体的数值。
无论您的问题是二分类还是多分类问题,您都可以指定'acc
'指标来报告准确率。
下面是一个使用了内置的精度指标的二分类问题的示例。
from numpy import array
from keras.models import Sequential
from keras.layers import Dense
from matplotlib import pyplot
# prepare sequence
X = array([0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0])
y = array([0, 0, 0, 0, 0, 1, 1, 1, 1, 1])
# create model
model = Sequential()
model.add(Dense(2, input_dim=1))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['acc'])
# train model
history = model.fit(X, y, epochs=400, batch_size=len(X), verbose=2)
# plot metrics
pyplot.plot(history.history['acc'])
pyplot.show()
运行该示例,在每个训练时期结束时输出了准确率。
...
Epoch 396/400
0s - loss: 0.5934 - acc: 0.9000
Epoch 397/400
0s - loss: 0.5932 - acc: 0.9000
Epoch 398/400
0s - loss: 0.5930 - acc: 0.9000
Epoch 399/400
0s - loss: 0.5927 - acc: 0.9000
Epoch 400/400
0s - loss: 0.5925 - acc: 0.9000
创建每次迭代结束后的精确度线图。
用于分类的内置 Keras 度量的线图
您还可以定义自己的度量标准,并在调用compile()
函数时在“metrics
”参数的函数列表中指定函数名称。
我经常想要跟踪的度量是均方根误差或 RMSE。
您可以通过检查现有指标的代码来了解如何编写自定义指标。
例如,下面是 Keras 中 mean_squared_error 损失函数和度量的代码。
def mean_squared_error(y_true, y_pred):
return K.mean(K.square(y_pred - y_true), axis=-1)
K 是 Keras 使用的后端。
该示例和损失函数和度量的其他示例中的方法是在后端使用标准数学函数来计算想要的度量。
例如,我们可以编写自定义指标来计算 RMSE,如下所示:
from keras import backend
def rmse(y_true, y_pred):
return backend.sqrt(backend.mean(backend.square(y_pred - y_true), axis=-1))
您可以发现该函数与 MSE 的代码相同,只是添加了sqrt()
包装结果。
我们可以在我们的回归示例中对此进行如下测试。请注意,我们只是直接列出函数名称,而不是将其作为 Keras 要解析的字符串或别名提供。
from numpy import array
from keras.models import Sequential
from keras.layers import Dense
from matplotlib import pyplot
from keras import backend
def rmse(y_true, y_pred):
return backend.sqrt(backend.mean(backend.square(y_pred - y_true), axis=-1))
# prepare sequence
X = array([0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0])
# create model
model = Sequential()
model.add(Dense(2, input_dim=1, activation='relu'))
model.add(Dense(1))
model.compile(loss='mse', optimizer='adam', metrics=[rmse])
# train model
history = model.fit(X, X, epochs=500, batch_size=len(X), verbose=2)
# plot metrics
pyplot.plot(history.history['rmse'])
pyplot.show()
运行该示例,在每个训练时期结束后返回自定义 RMSE 度量指标。
...
Epoch 496/500
0s - loss: 1.2992e-06 - rmse: 9.7909e-04
Epoch 497/500
0s - loss: 1.2681e-06 - rmse: 9.6731e-04
Epoch 498/500
0s - loss: 1.2377e-06 - rmse: 9.5562e-04
Epoch 499/500
0s - loss: 1.2079e-06 - rmse: 9.4403e-04
Epoch 500/500
0s - loss: 1.1788e-06 - rmse: 9.3261e-04
在运行结束时,将创建自定义 RMSE 度量标准的折线图。
用于回归的自定义 RMSE Keras 度量的线图
您的自定义度量函数必须在 Keras 内部数据结构上运行,根据所使用的后端可能会有所不同(例如使用 tensorflow 时tensorflow.python.framework.ops.Tensor
)而不是直接使用 原始 yhat 和 y 值。
出于这个原因,我建议尽可能使用后端数学函数来保持一致性和执行速度。
如果您要深入了解,本节将提供有关该主题的更多资源。
在本教程中,您了解了在训练深度学习模型时如何使用 Keras 指标。
具体来说,你学到了:
- Keras 指标的工作原理以及如何配置模型以在训练期间报告指标。
- 如何使用 Keras 内置的分类和回归指标。
- 如何在训练深度学习模型的同时有效地定义和返回自己的自定义指标。
你有任何问题吗? 在下面的评论中提出您的问题,我会尽力回答。