我有以下数据集,我想根据重复次数将此数据更改为目标输出数据集

Posted

技术标签:

【中文标题】我有以下数据集,我想根据重复次数将此数据更改为目标输出数据集【英文标题】:I have below dataset and i want to change this data into target output datatset on the basis of number of repetitions 【发布时间】:2019-04-12 10:54:14 【问题描述】:

我有以下数据集,我想对我的行进行多次重复并为它们分配索引。

提前致谢。感谢每一个建议:)

输入:

Col1    col2    col3    repetition
101 test1   10      2
102 test2   20      1
103 test3   30      2
104 test4   40      1

输出:

col1            col2           col3       index
101     test1       10      1
101     test1       10      2
102     test2       20      1
103     test3       30      1
103     test3       30      2
104     test4       40      1

【问题讨论】:

这是学校作业吗? 【参考方案1】:

这里有一些 java 代码描述了实现这一点的算法:

List<InputType> inputList = getInput();
List<OutputType> outputList = new ArrayList<>();

foreach(InputType input in inputList)
	for(int index = 1; index <= input.repetition)
		OutputType output = new OutputType(input.col1, input.col2, input.col3, index);
		outputList.add(output)
	


System.out.println(outputList);

【讨论】:

以上是关于我有以下数据集,我想根据重复次数将此数据更改为目标输出数据集的主要内容,如果未能解决你的问题,请参考以下文章

如何从 PySpark Dataframe 中删除重复项并将剩余列值更改为 null

平均观察在 Pandas 数据框中出现的总次数 [重复]

苹果拒绝我的应用程序在 Xcode 中将部署目标从 6.0 更改为 8.0 [重复]

将 9.90000000e+01 更改为 numpy nans

将项目的 .NET 目标框架从 4.0 更改为 3.5 后找不到文件(或程序集)

根据类别分布在训练和测试之间划分数据集[重复]