Normalization方法总结
归一化(Normalization)描述:
将数据映射到指定的范围,如:把数据映射到0~1或-1~1的范围之内处理。
作用:
数据映射到指定的范围内进行处理,更加便捷快速。
把有量纲表达式变成无量纲表达式,便于不同单位或量级的指标能够进行比较和加权。经过归一化后,将有量纲的数据集变成纯量,还可以达到简化计算的作用。
常见做法:Min-Max归一化
标准化(Normalization)注:在英文翻译中,归一化和标准化的翻译是一致的,而在实际使用中,我们需要根据实际的公式(或用途)去理解~
数据标准化方法有多种,如:直线型方法(如极值法、标准差法)、折线型方法(如三折线法)、曲线型方法(如半正态性分布)。不同的标准化方法,对系统的评价结果会产生不同的影响。其中,最常用的是Z-Score 标准化。
Z-Score 标准化其中,$\mu$为数据均值(mean),$\sigma$为标准差(std)。
描述:将原数据转换为符合均值为0,标准差为1的标准正态分布的新数据。
作用:
提升模型的收敛速度(加快梯度下降的求解速度)
提升模型的精度(消除量级和量纲的影响)
简化计算(与归一化的简化原 ...