mysql特征缩放计算

Posted

技术标签:

【中文标题】mysql特征缩放计算【英文标题】:mysql feature-scaling calculation 【发布时间】:2020-09-24 09:51:45 【问题描述】:

我需要制定一个 mysql 查询来选择以这种方式标准化的值: normalized = (value-min(values))/(max(values)-min(values)) 我的尝试如下所示:

select 
    Measurement_Values.Time, 
    ((Measurement_Values.Value-min(Measurement_Values.Value))/(max(Measurement_Values.Value)-min(Measurement_Values.Value))) 
from Measurement_Values  
where Measurement_Values.Measure_ID = 49 and Measurement_Values.time >= '2020-05-30 00:00'

但显然是错误的,因为它只返回一个值。 你能帮我找到正确的语法吗?

【问题讨论】:

【参考方案1】:

您的问题解释得有点短,但我认为您需要窗口函数(仅在 MySQL 8.0 中可用):

select 
    time, 
    value,
    (value - min(value) over() / (max(value) over() - min(value) over()) normalized_value
from measurement_values  
where measure_id = 49 and time >= '2020-05-30 00:00'

或者,在早期版本中,您可以通过使用聚合查询连接表来获得相同的结果:

select 
    mv.time, 
    mv.value,
    (mv.value - mx.min_value) / (mx.max_value - mx.min_value) normalized_value
from measurement_values  
cross join (
    select min(value) min_value, max(value) max_value
    from measurement_values
    where measure_id = 49 and time >= '2020-05-30 00:00'
) mx
where measure_id = 49 and time >= '2020-05-30 00:00'

【讨论】:

谢谢!我在 MariaDB 10.4(带有窗口函数)上尝试了您的第一个解决方案。当我在每个 over() 中添加一个 partition by(measure_id) 子句时,它就起作用了。 欢迎@AndreaG。如果我的回答正确回答了您的问题,请点击复选标志accept it。谢谢。

以上是关于mysql特征缩放计算的主要内容,如果未能解决你的问题,请参考以下文章

机器学习特征工程之特征缩放+无量纲化:最小最大缩放(MinMaxScaler)

机器学习特征工程之特征缩放+无量纲化:最大绝对值缩放(MaxAbsScaler)

机器学习特征工程之特征缩放+无量纲化:非线性缩放(例如,sigmoidtanharctan等)

特征缩放后重新缩放,线性回归

对不同的特征使用不同的特征缩放技术是不是正确?

机器学习中的特征缩放(feature scaling)