在 fft 之后进行分类
Posted
技术标签:
【中文标题】在 fft 之后进行分类【英文标题】:does the classification after a fft 【发布时间】:2016-08-07 13:27:25 【问题描述】:我有一个频谱,我会做 fft。我想用这些数据用 scikit-learn 进行学习。但是我知道将什么作为解释变量,即振幅或相位的频率。似乎也有处理数据的特定方法。如果你有想法谢谢你
例如对两个物种进行的测量
测量物种 1
Frequency [Hz] Peak amplitude Phase [degrees]
117.122319744375 2806130.78600507 -79.781679752725
234.24463948875 1913786.60902507 17.7111789273704
351.366959233125 808519.710937228 116.444676921222
468.4892789775 122095.42475935 25.5770279979328
585.520239658112 607116.287067349 142.264887989957
702.642559402487 604818.747928879 -112.469849617122
819.764879146862 277750.38203791 -15.0000950192717
936.887198891237 118608.971696726 -74.5121366118222
1054.00951863561 344484.145698282 -6.21161038546633
1171.13183837999 327156.097365635 97.0304114077862
1288.25415812436 133294.989030519 -42.5375933954097
1405.37647786874 112216.937121264 78.5147573168857
1522.49879761311 231245.476714294 -25.4436913705878
1639.62111735749 201337.057689481 -24.3659638609968
1756.6520780381 77785.2190703514 29.0468023773855
1873.77439778247 103345.482912432 -13.8433556624336
1990.89671752685 164252.685204496 32.0091367478569
2108.01903727122 131507.600569796 3.20717282723705
2225.1413570156 62446.6053497028 17.6656168494324
2342.26367675998 92615.8137781526 -2.92386499550556
测量物种 2
Frequency [Hz] Peak amplitude Phase [degrees]
117.122319744375 2786323.45338023 -78.5559125894388
234.24463948875 1915479.67743241 20.1586403367551
351.366959233125 830370.792189816 120.081294764269
468.4892789775 94486.3308071095 28.1762359863422
585.611598721875 590794.892175599 137.070646192436
702.642559402487 610017.558439343 -99.8603287979889
819.764879146862 300481.494163747 -7.0350571153689
936.887198891237 93989.1090623071 -52.6686900337389
1054.00951863561 332194.292343295 4.40278213901234
1171.13183837999 335166.932956212 92.5972261483014
1288.25415812436 154686.81104112 -64.5940556800747
1405.37647786874 91910.7647280088 82.3509804545009
1522.49879761311 223229.665336525 -64.4186985300827
1639.62111735749 211038.25587802 12.6057366375093
1756.74343710186 93456.4477333818 25.3398315513138
1873.77439778247 87937.8620001563 15.3447294063444
1990.89671752685 160213.112972346 7.41647669351739
2108.01903727122 141354.896010814 -48.4341201110724
2225.1413570156 69137.6327300227 39.9238718439715
2342.26367675998 82097.0663259956 -28.9291500313113
【问题讨论】:
你想做什么? Species 1 是一个物种的一组数据,您想使用频率、幅度和相位来学习区分 Species 1 和 Species 2? @Henry 这只是一个例子,但我有 1000 个物种,我想从这些数据中制作分类算法 但是你想做什么?您正在尝试构建一个 1000 类的多分类算法? @Henry 我有 2 个班级,物种是个体 我明白了。因此,您有 1000 个“行”,并且有两个类。每个物种包含大约 60 个特征?我的意思是问题有点简单。你必须有...Freq1, Amp1, Phase1, Freq2, Amp2, Phase2.....etc
和Class=1,0
。然后使用决策树分类器或支持向量机之类的东西对其进行分类。我怀疑你对训练样本的特征数量会让你很难得到很好的分离
【参考方案1】:
OP 正在询问如何对此进行分类。我已经在 cmets 中向他解释过,并将在此处进一步细分:
每个“物种”代表一行或一个样本。因此,每个样本有 60 个特征 (20x3) 他在做一个二分类问题 重新转换 FFT 的输出以将Freq1,Amp1,Phase1....etc
作为训练算法的数字输入集
使用 scikit-learn 中的支持向量机或决策树分类器之类的工具并在数据集上进行训练
评估和测量准确性
注意事项:超过 1000 个样本的 60 个特征可能很难分离并且容易过度拟合。 OP需要小心。我没有花太多时间了解特征本身,但我怀疑其中 20 个特征是多余的(样本之间的频率似乎总是相同)
【讨论】:
以上是关于在 fft 之后进行分类的主要内容,如果未能解决你的问题,请参考以下文章