我有以下数据集,我想根据重复次数将此数据更改为目标输出数据集
Posted
技术标签:
【中文标题】我有以下数据集,我想根据重复次数将此数据更改为目标输出数据集【英文标题】:I have below dataset and i want to change this data into target output datatset on the basis of number of repetitions 【发布时间】:2019-04-12 10:54:14 【问题描述】:我有以下数据集,我想对我的行进行多次重复并为它们分配索引。
提前致谢。感谢每一个建议:)
输入:
Col1 col2 col3 repetition
101 test1 10 2
102 test2 20 1
103 test3 30 2
104 test4 40 1
输出:
col1 col2 col3 index
101 test1 10 1
101 test1 10 2
102 test2 20 1
103 test3 30 1
103 test3 30 2
104 test4 40 1
【问题讨论】:
这是学校作业吗? 【参考方案1】:这里有一些 java 代码描述了实现这一点的算法:
List<InputType> inputList = getInput();
List<OutputType> outputList = new ArrayList<>();
foreach(InputType input in inputList)
for(int index = 1; index <= input.repetition)
OutputType output = new OutputType(input.col1, input.col2, input.col3, index);
outputList.add(output)
System.out.println(outputList);
【讨论】:
以上是关于我有以下数据集,我想根据重复次数将此数据更改为目标输出数据集的主要内容,如果未能解决你的问题,请参考以下文章
如何从 PySpark Dataframe 中删除重复项并将剩余列值更改为 null
苹果拒绝我的应用程序在 Xcode 中将部署目标从 6.0 更改为 8.0 [重复]
将 9.90000000e+01 更改为 numpy nans