根据先前数据的概率生成数据组合

Posted 2023-03-12

技术标签:

【中文标题】根据先前数据的概率生成数据组合【英文标题】：Generating combinations of data based on probability of previous data 【发布时间】：2015-12-01 09:43:27 【问题描述】：

我有以下类型的数据集（示例）：

食物类型：中国、印度、泰国、墨西哥

成分1：盐、中盐

成分 2：辣椒、红辣椒、泰国辣椒、青辣椒

成分 3：姜黄、小豆蔻、

成分 4：鸡肉、牛肉、鱼、豆腐

我有一些手工制作的数据组合，我根据成分和食谱将它们分类为不同的食物类型。我需要根据最可能的组合生成更多数据。到目前为止，我所做的一种方法是生成所有成分的所有组合，然后根据之前的学习将它们分类为食物类型。但这种方法不实用，因为数据很大。每个类别的成分可以有超过 30-40 个值。此外，成分不仅仅是 4，它们在真实数据集中更多。我正在寻找比我已经提出的方法更好的方法来生成和分类数据。我已应用 NB 分类器对数据进行分类。非常感谢您的帮助

【问题讨论】：

【参考方案1】：

由于我 4 四个多月没有收到任何回复，我想发布我的解决方案，这可能对其他人有所帮助。

我使用的技术是从每种属性类型（在我的示例中为食物类型）中获取前五个最重要的特征。然后我组合了所有这些功能。对于其余的功能，我随机选择了一个值。这产生了大小可控的新数据。

如果您需要任何说明，请随时询问。

【讨论】：

以上是关于根据先前数据的概率生成数据组合的主要内容，如果未能解决你的问题，请参考以下文章

根据另一列 SQL 动态生成一列的数据组合

如何在 JavaScript 中根据概率组合对象数组？

RadCombobox没有显示正确的属性值

[世界杯]根据赔率计算各种组合可能性与赔率

matlab中1和0等概率的所有组合的二进制矩阵

返回未绑定访问组合框的先前值