预测用户是不是能够解决问题

Posted

技术标签:

【中文标题】预测用户是不是能够解决问题【英文标题】:Making prediction whether user will be able to solve a thing or not预测用户是否能够解决问题 【发布时间】:2016-04-29 23:10:14 【问题描述】:

我在 csv 中有 3 个数据集 带有属性的问题.csv:

    身份证 级别 准确度 solved_count error_count 标签1 标签2 标签3 标签4 标签5

带有属性的Submission.csv:

user_id problem_id 已解决状态

user.csv 与

user_id solved_count 尝试

我现在想在测试数据集上预测用户是否能够解决问题。

我正在考虑应用朴素贝叶斯分类。但我不知道如何解决这个问题。我想我必须在 arff 中制作一个通用数据集,以便与 Weka 或 sckit learn 一起使用。告诉我如何解决这个问题。

【问题讨论】:

【参考方案1】:

如果您想使用 weka,您应该将所有数据集连接在一起。 获取一组属性如下:

user_id 身份证 级别 准确度 solved_count error_count 标签1 标签2 标签3 标签4 标签5 solved_count 尝试 solved_status(这将是你的课程)

完成这项工作后,您必须将数据集加载到 weka explorer 或 java 代码中。 您必须根据您的数据集构建分类器。 然后,您可以预测solved_status 将为空的新实例。

【讨论】:

你可以使用不同的分类器。最常见的是j48、随机森林、朴素贝叶斯、knn、svn。检查所有这些并选择获得最佳结果的那个。

以上是关于预测用户是不是能够解决问题的主要内容,如果未能解决你的问题,请参考以下文章

用户触达难?流失率高?HMS Core预测服务和智能运营,助你提前掌握营销时机,解决此难题。

在线学习--online learning

如何应对频繁上课?

预测房价:人工智能回归问题

预测房价:人工智能回归问题

QoS预测方向利用数据增强进行QoS预测