无需打开即可拆分 Excel 文件

Posted

技术标签:

【中文标题】无需打开即可拆分 Excel 文件【英文标题】:Split Excel file without Opening 【发布时间】:2019-11-27 16:07:43 【问题描述】:

我在 Hackathons 或 Kaggle 比赛期间获得了大小为 Gb 的 excel 文件。如果我直接打开它或在 python 或 R 中加载它,我的 8gb i7 intel 系统会崩溃。 我想知道是否有任何方法可以在不打开文件的情况下拆分文件

【问题讨论】:

在 Python 中,我相信是这样。在 Excel 中,没有。我会将标签添加到您开放用于解决方案的语言中。 python 人没有看到这篇文章,因为它只用 Excel 标记 打开一个新工作簿并使用 vba 中的 SQL 查询来拆分它。 ***.com/questions/27385245/… 如果你使用的是 unix 那么有built-in split man7.org/linux/man-pages/man1/split.1.html 【参考方案1】:
 Splits a CSV file into multiple pieces.

A quick bastardization of the Python CSV library.

Arguments:

    `row_limit`: The number of rows you want in each output file. 10,000 by default.
    `output_name_template`: A %s-style template for the numbered output files.
    `output_path`: Where to stick the output files.
    `keep_headers`: Whether or not to print the headers in each output file.

Example usage:

    >> from toolbox import csv_splitter;
    >> csv_splitter.split(open('/home/ben/input.csv', 'r'));
reader = csv.reader(filehandler, delimiter=delimiter)
current_piece = 1
current_out_path = os.path.join(
     output_path,
     output_name_template  % current_piece
)
current_out_writer = csv.writer(open(current_out_path, 'w'), delimiter=delimiter)
current_limit = row_limit
if keep_headers:
    headers = next(reader)
    current_out_writer.writerow(headers)
for i, row in enumerate(reader):
    if i + 1 > current_limit:
        current_piece += 1
        current_limit = row_limit * current_piece
        current_out_path = os.path.join(
           output_path,
           output_name_template  % current_piece
        )
        current_out_writer = csv.writer(open(current_out_path, 'w'), delimiter=delimiter)
        if keep_headers:
            current_out_writer.writerow(headers)
    current_out_writer.writerow(row)

【讨论】:

以上是关于无需打开即可拆分 Excel 文件的主要内容,如果未能解决你的问题,请参考以下文章

按照某列属性拆分Excel文件

如何剪切/拆分大excel数据? [关闭]

怎样将一个excel表格的多个sheet拆分成多个excel表

如何拆分TXT文件

将excel根据列名称拆分成多个文件

如何拆分excel 多个工作表