加速度计传感器数据挖掘方法
Posted
技术标签:
【中文标题】加速度计传感器数据挖掘方法【英文标题】:Approach towards Mining Accelerometer Sensor Data 【发布时间】:2015-06-02 17:54:51 【问题描述】:我是数据挖掘的新手,对我在大学工作的一个项目有一些基本问题。
数据:我们决定从一组 21 个人(针对他们的不同活动,如步行、慢跑、跑步等)挖掘加速度计和陀螺仪传感器读数,并提出分类解决方案。
我的问题是:
由于读数属于连续数据(频率为 50 Hz 的数据), 我应该如何对数据进行采样。我会拿一个数据窗口吗?有没有沿着这条线的任何标准程序。
我应该使用什么样的模型来支持这种连续/顺序数据?隐马尔可夫模型是正确的方法吗?
一旦模型到达,它是否会再次将测试集中的一个窗口(或一系列)数据作为输入来预测活动?
【问题讨论】:
【参考方案1】:这个问题在科学文献中被称为人类活动检测,有很多论文展示了不同的方法。可以在 Sensors 2017 第 17 卷第 3 期A Comprehensive Analysis on Wearable Acceleration Sensors in Human Activity Recognition 中找到最近的一个总结。
人体活动识别 (HAR) 从运动传感器收集数据开始。数据被划分为窗口以应用特征提取,从而从原始信号中过滤相关信息。之后,提取的特征被用作最终 HAR 模型的每个分类器的输入。
...我们探索了 293 种不同的分类器,包括决策树、判别分析、支持向量机、K-最近邻、集成方法、朴素贝叶斯和神经网络。
...经过上述特征提取过程,每个segment一共得到176个特征,然后使用min-max归一化缩放到区间[0, 1],用于分类:
平均值、最小值、最大值、中值、标准偏差、偏度、峰度、信号功率、均方根、峰值强度...
【讨论】:
【参考方案2】:您要问的是基本的数字信号处理问题,与数据挖掘没有太大关系。您应该阅读 DSP 简介,否则您将无法真正理解自己在做什么,并且每个人都可能正确地批评您的结果。
Biomed conference proceedings 中涉及振动关节造影,即基于多次振动测量的膝关节健康分类,因此您可能需要阅读现有文献。
由于读数属于连续数据(频率为 50 Hz 的数据),我应该如何对数据进行采样。我会拿一个数据窗口吗?有没有沿着这条线的任何标准程序。
是的,您可能必须选择部分数据。通常,您首先必须找到这些数据之间的时间对齐(通常最大相关性可以帮助您找到),或者您需要将此类数据转换为时不变的形式(傅立叶变换、功率谱密度等)。
您需要了解奈奎斯特极限是什么,并且您需要对信号理论有扎实的了解才能对数据做一些有用的事情。
我应该使用什么样的模型来支持这种连续/顺序数据?隐马尔可夫模型是正确的方法吗?
隐马尔可夫对于这个类的信号根本没有意义。找到一个好的分类器是一项困难的工作,您需要经验和大量的反复试验才能找到一个好的分类器。没有单一的正确方法,除非您可以在数学上准确地描述您的信号以证明存在最佳分类器。这将需要对您的信号如何“工作”有很多了解。
一旦模型到达,它是否会再次将测试集中的一个窗口(或一系列)数据作为输入来预测活动?
这取决于你想出的模型。
编辑:免责声明:我隶属于我在上面引用的那个项目,所以我可能有偏见。
【讨论】:
非常感谢马库斯。很棒的见解,正在探索傅立叶变换。以上是关于加速度计传感器数据挖掘方法的主要内容,如果未能解决你的问题,请参考以下文章
无法在一项活动中获取加速度计传感器和 GPS 位置数据,问题出在哪里?