通过模型计算
表示的影响因素所对应的房价应该是
, 但实际数据告诉我们房价是
。这时我们需要有某种指标来衡量预测值
跟真实值
之间的差距。对于回归问题,最常采用的衡量方法是使用均方误差作为评价模型好坏的指标,具体定义如下:
(简记为:
)通常也被称作损失函数,它是衡量模型好坏的指标。在回归问题中均方误差是一种比较常见的形式,分类问题中通常会采用交叉熵作为损失函数,在后续的章节中会更详细的介绍。对一个样本计算损失的代码实现如下:
因为计算损失时需要把每个样本的损失都考虑到,所以我们需要对单个样本的损失函数进行求和,并除以样本总数
。
在Network类下面添加损失函数的计算过程如下:
使用定义的Network类,可以方便的计算预测值和损失函数。需要注意的是,类中的变量
,
,
,
,
等均是向量。以变量
为例,共有两个维度,一个代表特征数量(值为13),一个代表样本数量,代码如下所示。