平均绝对误差

平均绝对误差

提示:此条目的主题不是平均差。

在统计学中,平均绝对误差 (英語:Mean absolute error,缩写:MAE)是对表达同一现象的成对观测值之间误差的测量。 Y与X比较的例子包括预测值与观测值的比较、后续时间与初始时间的比较,以及一种测量技术与另一种测量技术的比较。 平均绝对误差MAE的计算方法是绝对误差之和(即曼哈顿距离)除以样本量:[1]

M

A

E

=

i

=

1

n

|

y

i

x

i

|

n

=

i

=

1

n

|

e

i

|

n

.

{\displaystyle \mathrm {MAE} ={\frac {\sum _{i=1}^{n}\left|y_{i}-x_{i}\right|}{n}}={\frac {\sum _{i=1}^{n}\left|e_{i}\right|}{n}}.}

因此,它是绝对误差的算术平均值

|

e

i

|

=

|

y

i

x

i

|

{\displaystyle |e_{i}|=|y_{i}-x_{i}|}

, 其中

y

i

{\displaystyle y_{i}}

是预测值,和

x

i

{\displaystyle x_{i}}

是真实值。其他公式可将相对频率作为权重因子。平均绝对误差使用与测量数据相同的标度。这被称为与标度相关的精度度量 (scale-dependent accuracy measure),因此不能用于对使用不同标度的预测值进行比较。[2]。 平均绝对误差是时间序列分析中预测误差(英语:Forecast error)的一个常用度量, 有时会与更标准的平均绝对离差(英語:mean absolute deviation)的定义混淆。 在更广泛的意义上也存在同样的混淆。

数量差异和分配差异[编辑]

两个数据点的平均绝对误差(MAE) 和均方根误差 (RMSE) ,数量差异为 0,分配差异为 2。

在遥感中,平均绝对误差(MAE)有时表示为两个部分的总和:数量差异 (quantity disagreement) 和分配差异 (allocation disagreement)。数量差异是平均误差的绝对值:[3]

|

i

=

1

n

y

i

x

i

n

|

.

{\displaystyle \left|{\frac {\sum _{i=1}^{n}y_{i}-x_{i}}{n}}\right|.}

分配差异是平均绝对误差(MAE)减去数量差异。

还可以通过观察

(

x

,

y

)

{\displaystyle (x,y)}

图形来识别差异类型。当X值的平均值不等于Y值的平均值时,就存在数量差异。当且仅当点位于同一直线两侧时才存在分配差异。[3][4]

相关测量方法[编辑]

平均绝对误差是比较预测与最终结果的多种方法之一。公认的替代方法有平均绝对缩放误差 (mean absolute scaled error, MASE)、平均绝对对数误差 (mean absolute scaled error (MASE), MALE) 和均方误差 (mean squared error, MSE)。这些方法都是在不考虑预测过高或过低方向的情况下总结预测结果的;而平均符号差 (mean signed difference, MSD)则是一种强调这一点的测量方法。

在使用选定的性能指标对预测模型进行拟合时,从最小二乘法与均方误差相关的意义上讲,与均方绝对误差相对应的是最小绝对偏差 (least absolute deviations, LAD)。

平均绝对误差与均方根误差 (RMSE) 并不完全相同,尽管有些研究人员是这样报告和解释的。平均绝对误差在概念上比均方根误差更简单,也更容易解释:它只是散点图中每个点与 Y=X 线之间的平均绝对垂直或水平距离。换句话说,平均绝对误差是X和Y之间的平均绝对差值。此外,每个误差对平均绝对误差的影响与误差的绝对值成正比。这与均方根误差不同,均方根误差涉及差值的平方,因此几个较大的差值会使均方根误差比平均绝对误差增加更多。[3]

参阅[编辑]

曼哈頓距離

参考文献[编辑]

^ Willmott, Cort J.; Matsuura, Kenji. Advantages of the mean absolute error (MAE) over the root mean square error (RMSE) in assessing average model performance. Climate Research. December 19, 2005, 30: 79–82. doi:10.3354/cr030079 .

^ 2.5 Evaluating forecast accuracy | OTexts. www.otexts.org. [2016-05-18]. (原始内容存档于2018-01-17).

^ 3.0 3.1 3.2 Pontius Jr., Robert Gilmore; Thontteh, Olufunmilayo; Chen, Hao. Components of information for multiple resolution comparison between maps that share a real variable (PDF). Environmental and Ecological Statistics. 2008, 15 (2): 111–142. S2CID 21427573. doi:10.1007/s10651-007-0043-y.

^ Willmott, C. J.; Matsuura, K. On the use of dimensioned measures of error to evaluate the performance of spatial interpolators. International Journal of Geographical Information Science. January 2006, 20: 89–102. S2CID 15407960. doi:10.1080/13658810500286976.

这是一篇與統計學相關的小作品。您可以通过编辑或修订扩充其内容。查论编