如何将多个文件进行合并？

Posted 2023-05-01

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了如何将多个文件进行合并？相关的知识，希望对你有一定的参考价值。

参考技术A 我们都知道DOS命令Copy的主要作用是复制文件，可是你是否知道，它还有一个作用是合并文件呢？一般情况下，它主要用于合并相同类型的文件，比如将两个文本文件合并为一个文本文件、将两个独立的MPEG视频文件合并为一个连续的视频文件等。那么，如果用它合并两个不同类型的文件，结果会怎样呢？巧妙地将一个文本文件合并到一个非文本文件中，可以实现隐藏秘密的作用。一起来看看吧。
比如你有一段私人信息要隐藏起来，请先录入并保存为文本文件，假设保存为23du.txt。另找一个非文本文件，最好为图片文件或可执行文件。以图片文件为例，假设它的文件名为23du.jpg。如果把它们都放到D盘根目录下，那么在Windows的MS-DOS方式下执行以下命令：
d:\Copy 23du.jpg/b + 23du.txt/a 23du_com.jpg
其中参数/b指定以二进制格式复制、合并文件；参数/a指定以ASCII格式复制、合并文件。这里要注意文件的顺序，二进制格式的文件应放在加号前，文本格式的文件放在加号后。
执行该命令后，生成了一个新文件23du_com.jpg。回到Windows中用图片浏览软件打开这个它，你会发现它与23du.jpg的显示结果一模一样——别着急，秘密马上揭晓！
按照这种方法，你可以轻松地把一些重要信息隐藏起来，比如用户ID、密码、重要私人信息等。
另外，你合并好文件后千万不要用记事本作任何改动，否则，你的图片就不能正常显示了。切记！
还有，要把两个视频文件合并成一个视频文件更简单，可以用下面的方法：
使用Windows自带的MS-DOS(Windows98）或CMD（Windows 2000/XP)程序即可完成合并操作。具体方法如下：
1.先把文件放在同一个目录下，最好是根目录，因为这样方便，当然，也可以放在同一个文件夹内，但文件夹一定要用英文名。
2.单击“开始”菜单，选择“运行”。然后在运行框内输入CMD（如果你的系统是2000或XP）或者command（如果您的系统是98），按确定即可进入命令行程序。
3.通过输入命令进入视频文件所在目录。假设您的2个文件名为：1.vob和2.vob，并且他们在同一个目录下，那么按照如下操作：输入
copy /b 1.mov+2.mov 3.mov（注意空格：copy[空格]/b[空格]1.mov+2.mov[空格]3.mov）

Spring Batch中如何读取多个CSV文件合并数据进行处理？

【中文标题】Spring Batch中如何读取多个CSV文件合并数据进行处理？【英文标题】：How to read multiple CSV files in Spring Batch to merge the data for processing? 【发布时间】：2020-01-19 15:29:06 【问题描述】：

我是 Spring Batch 的新手，并试图获得一些关于以下要求的指导。

总体要求：

我必须从不同的系统获取数据，应用一些业务逻辑，将结果保存到数据库中。

下面是一个例子。

我需要从 3 个 CSV 文件中读取数据。第一个文件 - person.csv - 包含名称和 ID 第二个文件——address.csv——包含每个人的地址信息。一个人可以有零个或多个地址。第三个文件——employment.csv——包含每个人的就业信息。一个人可以有零个或多个雇主。

这是一些示例。

Person.csv###（总大小为 800 万）

“人名”、“人名”

1，乔伊

2，钱德勒

3，罗斯

4，莫妮卡

地址.csv

“personID”、“addressType”、“state”

1，住宅，纽约

1、邮寄、NC

2，住宅，纽约

4，住宅，纽约

4、邮寄、DC

就业.csv

"personID", "employerName"

1，雇员1

2, emp2

2, emp3

3, emp4

注意：每个文件都按人员 ID 排序。

要应用业务逻辑，我需要合并每个人的数据，即我需要合并一个人的人员、地址、就业数据以应用逻辑。你能建议任何方法吗？

【问题讨论】：

Combine rows from 2 files and write to DB using Spring Batch的可能重复我认为不是重复的。该子链接中的解决方案仅适用于具有相同列和顺序的文件 【参考方案1】：

听起来像是 4 step，工作。您必须决定步骤 1 到 3 的中间结果应该存放在哪里。

如果所有 CSV 文件中的数据都适合内存，那么步骤 1 到 3 的中间结果可能只是 Map，以 personID 作为键。如果不是，那么步骤 1 到 3 的中间结果可能应该写入数据库中的临时表。

假设所有数据都适合内存，创建一个可以注入到步骤 1 到 3 的 ItemWriters 的 bean，例如：

// in a config class...
// assuming PersonID is of type Long
// Assuming Person class has appropriate attributes
Map<Long, Person> people = new HashMap<>();

第 1 步：

ItemReader - 读取下一个 Person.CSV 行并创建一个 Person 实例 ItemProcessor - 无事可做 - 将 Person 实例传递给 ItemWriter ItemWriter - 将 Person 实例添加到 people 地图（或中间表）。

第 2 步：

ItemReader - 读取下一个 Address.CSV 行并创建一个 Address 实例 ItemProcessor - 无事可做 - 将 Address 实例传递给 ItemWriter ItemWriter - 将地址添加到来自people 映射（或中间表）的相关人员。 TODO：如果一个人的地址不存在怎么办？

第 3 步：

ItemReader - 读取下一个就业.CSV 行并创建一个就业实例 ItemProcessor - 无事可做 - 将就业实例传递给 ItemWriter ItemWriter - 将就业添加到来自people 映射（或中间表）的相关人员。 TODO：如果有一个不存在的人的工作应该怎么办？

由于在步骤 1 到 3 中 ItemProcessor 无需执行任何操作，因此使用 Tasklet 可能会更好。

此外，步骤 1 到 3 可以并行完成。它可能会提高性能，但会增加复杂性以确保正确填充 people。

第 4 步：

ItemReader - 读取people（或中间表中的复合对象）的下一个元素 ItemProcessor - 应用业务逻辑 ItemWriter - 将结果写入数据库

【讨论】：

感谢安德鲁的意见。感谢安德鲁的意见。我的批次的有效负载大小非常高。我将有大约 800 万人，并且没有任何临时表。所以，我将无法在内存中处理。因为那里没有临时表，我相信我唯一的选择是使用中间 csv/xml/json。这将增加处理时间。使用数据库存储步骤 1 到 3 的中间结果。请参阅readers/writers，它可以轻松处理与常见数据库平台的交互。

以上是关于如何将多个文件进行合并？的主要内容，如果未能解决你的问题，请参考以下文章

arcgis中如何将多个shp文件合并

c#如何合并多个dll文件

arcgis中如何将多个shp文件，比如点文件进行合并

Linux怎么用命令合并多个文件为一个

如何将多个excel文件合并？

你好，arcgis中如何将多个shp文件，比如点文件进行合并，怎么用python编程啊