在 fft 之后进行分类

Posted

技术标签:

【中文标题】在 fft 之后进行分类【英文标题】:does the classification after a fft 【发布时间】:2016-08-07 13:27:25 【问题描述】:

我有一个频谱,我会做 fft。我想用这些数据用 scikit-learn 进行学习。但是我知道将什么作为解释变量,即振幅或相位的频率。似乎也有处理数据的特定方法。如果你有想法谢谢你

例如对两个物种进行的测量

测量物种 1

   Frequency [Hz]           Peak amplitude           Phase [degrees]
   117.122319744375         2806130.78600507         -79.781679752725
   234.24463948875          1913786.60902507         17.7111789273704
   351.366959233125         808519.710937228         116.444676921222
   468.4892789775           122095.42475935          25.5770279979328
   585.520239658112         607116.287067349         142.264887989957
   702.642559402487         604818.747928879         -112.469849617122
   819.764879146862         277750.38203791          -15.0000950192717
   936.887198891237         118608.971696726         -74.5121366118222
   1054.00951863561         344484.145698282         -6.21161038546633
   1171.13183837999         327156.097365635         97.0304114077862
   1288.25415812436         133294.989030519         -42.5375933954097
   1405.37647786874         112216.937121264         78.5147573168857
   1522.49879761311         231245.476714294         -25.4436913705878
   1639.62111735749         201337.057689481         -24.3659638609968
   1756.6520780381          77785.2190703514         29.0468023773855
   1873.77439778247         103345.482912432         -13.8433556624336
   1990.89671752685         164252.685204496         32.0091367478569
   2108.01903727122         131507.600569796         3.20717282723705
   2225.1413570156          62446.6053497028         17.6656168494324
   2342.26367675998         92615.8137781526         -2.92386499550556

测量物种 2

    Frequency [Hz]           Peak amplitude           Phase [degrees]
   117.122319744375         2786323.45338023         -78.5559125894388
   234.24463948875          1915479.67743241         20.1586403367551
   351.366959233125         830370.792189816         120.081294764269
   468.4892789775           94486.3308071095         28.1762359863422
   585.611598721875         590794.892175599         137.070646192436
   702.642559402487         610017.558439343         -99.8603287979889
   819.764879146862         300481.494163747         -7.0350571153689
   936.887198891237         93989.1090623071         -52.6686900337389
   1054.00951863561         332194.292343295         4.40278213901234
   1171.13183837999         335166.932956212         92.5972261483014
   1288.25415812436         154686.81104112          -64.5940556800747
   1405.37647786874         91910.7647280088         82.3509804545009
   1522.49879761311         223229.665336525         -64.4186985300827
   1639.62111735749         211038.25587802          12.6057366375093
   1756.74343710186         93456.4477333818         25.3398315513138
   1873.77439778247         87937.8620001563         15.3447294063444
   1990.89671752685         160213.112972346         7.41647669351739
   2108.01903727122         141354.896010814         -48.4341201110724
   2225.1413570156          69137.6327300227         39.9238718439715
   2342.26367675998         82097.0663259956         -28.9291500313113

【问题讨论】:

你想做什么? Species 1 是一个物种的一组数据,您想使用频率、幅度和相位来学习区分 Species 1 和 Species 2? @Henry 这只是一个例子,但我有 1000 个物种,我想从这些数据中制作分类算法 但是你想做什么?您正在尝试构建一个 1000 类的多分类算法? @Henry 我有 2 个班级,物种是个体 我明白了。因此,您有 1000 个“行”,并且有两个类。每个物种包含大约 60 个特征?我的意思是问题有点简单。你必须有...Freq1, Amp1, Phase1, Freq2, Amp2, Phase2.....etcClass=1,0。然后使用决策树分类器或支持向量机之类的东西对其进行分类。我怀疑你对训练样本的特征数量会让你很难得到很好的分离 【参考方案1】:

OP 正在询问如何对此进行分类。我已经在 cmets 中向他解释过,并将在此处进一步细分:

每个“物种”代表一行或一个样本。因此,每个样本有 60 个特征 (20x3) 他在做一个二分类问题 重新转换 FFT 的输出以将 Freq1,Amp1,Phase1....etc 作为训练算法的数字输入集 使用 scikit-learn 中的支持向量机或决策树分类器之类的工具并在数据集上进行训练 评估和测量准确性

注意事项:超过 1000 个样本的 60 个特征可能很难分离并且容易过度拟合。 OP需要小心。我没有花太多时间了解特征本身,但我怀疑其中 20 个特征是多余的(样本之间的频率似乎总是相同)

【讨论】:

以上是关于在 fft 之后进行分类的主要内容,如果未能解决你的问题,请参考以下文章

曲线分类-特征提取

使用 StanfordNLP 分类器进行分词的文本分类器

第二天学习进度--文本情感分类

Weka 分类器精度

spss独立样本t分类变量??

《问题总结》frontpagesetting企业分类排序之后,修改下拉选项值,排序列表重新回到原始状态