数值分类器 (?) Weka / R

Posted

技术标签:

【中文标题】数值分类器 (?) Weka / R【英文标题】:Numerical classifier (?) Weka / R 【发布时间】:2012-11-06 21:13:57 【问题描述】:

我有一个具有“n 到 m”关系的数字数据集(作为数据库表)。例如:

A | B
-----
1 | 1
1 | 2
1 | 9
4 | 2
7 | 8
7 | 11

我想“训练”一个分类器(使用 weka?)来告诉我哪个 A 最有可能成为一组 B。举个例子:[1,2,8] 应该告诉我一些类似于 1:2, 4:1, 7:1 的内容,即:“该集合在 A N 次被发现”

我当然可以用 sql 和我最喜欢的脚本语言来实现它。但是,我想知道是否有更多 - 我猜是“正式的” - 方式来做到这一点。我有 weka 运行,并且我连接了我的数据库,但是我迷失了要采用哪个分类器(许多拒绝服务),我也非常感谢一些理论背景的链接(例如它叫什么我喜欢做的事情和存在哪些改进)。

如果您在 R 中更通用,我也会欣赏“R”方式。(但是,我不仅对解决我的问题感兴趣,而且对了解这是什么类型的问题感兴趣 - 我会通过 weka 解决方案。)如果这是一个重复的问题,我很抱歉,但遗憾的是我缺乏指定我在这里寻找的信息的信息。可视化和其他学习和研究的输出会很棒,你。

提前感谢您的阅读,希望您能提供帮助。

【问题讨论】:

我可以通过删除重复的 B 来减少数据的“m 到 n”性质,但是这应该是可选的。当然,我可以重新组织我的数据。 【参考方案1】:

在 R 中,您可以执行以下操作:

foo = data.frame(A=c(1,1,1,4,7,7),B=c(1,2,9,2,8,11))
foo
#   A  B
# 1 1  1
# 2 1  2
# 3 1  9
# 4 4  2
# 5 7  8
# 6 7 11

table(foo[foo$B %in% c(1,2,8),]$A)

# 1 4 7 
# 2 1 1 

你还需要什么吗?

【讨论】:

感谢您的回答!你能告诉我这是怎么称呼的吗?我对weka特别感兴趣,就是想知道怎么称呼它,也就是它是一种什么样的“分类”(我应该多表达一下)。否则,感谢您的 R 解决方案,如果没有人可以在 weka 中回答我的问题或提供对该主题的更多见解,我将接受它作为解决方案。 这些只是 R 的非常基本的运算符/功能。我没有使用真正的“分类器”,您的问题也不需要分类器 - 像 svm - 来回答。我认为——但我不能保证——R 比 weka 更灵活,因为它提供了大量可供开发人员使用的软件包,尽管 weka 真的很棒。 是的,我怀疑这一点,谢谢。这就是为什么 weka 解决方案(如果存在)会告诉我更多关于问题的性质以及它是否是分类器的原因。但我很欣赏你的 R 解决方案,如果我找不到更多信息,我可能会使用它!

以上是关于数值分类器 (?) Weka / R的主要内容,如果未能解决你的问题,请参考以下文章

解析决策树(来自 WEKA 分类器)以在 R 中绘图?

Weka 逻辑分类器不可用

使用测试集中的缺失值评估 weka 分类器 J48,R RWeka

如何在weka中预处理数据以进行分类

在 MOA 中使用我的 weka 分类器

使用weka对传感器数据进行分类