数值分类器 (?) Weka / R
Posted
技术标签:
【中文标题】数值分类器 (?) Weka / R【英文标题】:Numerical classifier (?) Weka / R 【发布时间】:2012-11-06 21:13:57 【问题描述】:我有一个具有“n 到 m”关系的数字数据集(作为数据库表)。例如:
A | B
-----
1 | 1
1 | 2
1 | 9
4 | 2
7 | 8
7 | 11
我想“训练”一个分类器(使用 weka?)来告诉我哪个 A 最有可能成为一组 B。举个例子:[1,2,8] 应该告诉我一些类似于 1:2, 4:1, 7:1 的内容,即:“该集合在 A N 次被发现”
我当然可以用 sql 和我最喜欢的脚本语言来实现它。但是,我想知道是否有更多 - 我猜是“正式的” - 方式来做到这一点。我有 weka 运行,并且我连接了我的数据库,但是我迷失了要采用哪个分类器(许多拒绝服务),我也非常感谢一些理论背景的链接(例如它叫什么我喜欢做的事情和存在哪些改进)。
如果您在 R 中更通用,我也会欣赏“R”方式。(但是,我不仅对解决我的问题感兴趣,而且对了解这是什么类型的问题感兴趣 - 我会通过 weka 解决方案。)如果这是一个重复的问题,我很抱歉,但遗憾的是我缺乏指定我在这里寻找的信息的信息。可视化和其他学习和研究的输出会很棒,你。
提前感谢您的阅读,希望您能提供帮助。
【问题讨论】:
我可以通过删除重复的 B 来减少数据的“m 到 n”性质,但是这应该是可选的。当然,我可以重新组织我的数据。 【参考方案1】:在 R 中,您可以执行以下操作:
foo = data.frame(A=c(1,1,1,4,7,7),B=c(1,2,9,2,8,11))
foo
# A B
# 1 1 1
# 2 1 2
# 3 1 9
# 4 4 2
# 5 7 8
# 6 7 11
table(foo[foo$B %in% c(1,2,8),]$A)
# 1 4 7
# 2 1 1
你还需要什么吗?
【讨论】:
感谢您的回答!你能告诉我这是怎么称呼的吗?我对weka特别感兴趣,就是想知道怎么称呼它,也就是它是一种什么样的“分类”(我应该多表达一下)。否则,感谢您的 R 解决方案,如果没有人可以在 weka 中回答我的问题或提供对该主题的更多见解,我将接受它作为解决方案。 这些只是 R 的非常基本的运算符/功能。我没有使用真正的“分类器”,您的问题也不需要分类器 - 像 svm - 来回答。我认为——但我不能保证——R 比 weka 更灵活,因为它提供了大量可供开发人员使用的软件包,尽管 weka 真的很棒。 是的,我怀疑这一点,谢谢。这就是为什么 weka 解决方案(如果存在)会告诉我更多关于问题的性质以及它是否是分类器的原因。但我很欣赏你的 R 解决方案,如果我找不到更多信息,我可能会使用它!以上是关于数值分类器 (?) Weka / R的主要内容,如果未能解决你的问题,请参考以下文章