预测用户是不是能够解决问题
Posted
技术标签:
【中文标题】预测用户是不是能够解决问题【英文标题】:Making prediction whether user will be able to solve a thing or not预测用户是否能够解决问题 【发布时间】:2016-04-29 23:10:14 【问题描述】:我在 csv 中有 3 个数据集 带有属性的问题.csv:
-
身份证
级别
准确度
solved_count
error_count
标签1
标签2
标签3
标签4
标签5
带有属性的Submission.csv:
user_id problem_id 已解决状态user.csv 与
user_id solved_count 尝试我现在想在测试数据集上预测用户是否能够解决问题。
我正在考虑应用朴素贝叶斯分类。但我不知道如何解决这个问题。我想我必须在 arff 中制作一个通用数据集,以便与 Weka 或 sckit learn 一起使用。告诉我如何解决这个问题。
【问题讨论】:
【参考方案1】:如果您想使用 weka,您应该将所有数据集连接在一起。 获取一组属性如下:
user_id 身份证 级别 准确度 solved_count error_count 标签1 标签2 标签3 标签4 标签5 solved_count 尝试 solved_status(这将是你的课程)完成这项工作后,您必须将数据集加载到 weka explorer 或 java 代码中。 您必须根据您的数据集构建分类器。 然后,您可以预测solved_status 将为空的新实例。
【讨论】:
你可以使用不同的分类器。最常见的是j48、随机森林、朴素贝叶斯、knn、svn。检查所有这些并选择获得最佳结果的那个。以上是关于预测用户是不是能够解决问题的主要内容,如果未能解决你的问题,请参考以下文章