Python将csv转换为xlsx

Posted

技术标签:

【中文标题】Python将csv转换为xlsx【英文标题】:Python convert csv to xlsx 【发布时间】:2013-07-15 02:38:39 【问题描述】:

this post 中有一个 Python 示例可以将 csv 转换为 xls。

但是,我的文件有超过 65536 行,所以 xls 不起作用。如果我将文件命名为 xlsx,它并没有什么不同。有没有可以转换成xlsx的Python包?

【问题讨论】:

【参考方案1】:

这是一个使用xlsxwriter的例子:

import os
import glob
import csv
from xlsxwriter.workbook import Workbook


for csvfile in glob.glob(os.path.join('.', '*.csv')):
    workbook = Workbook(csvfile[:-4] + '.xlsx')
    worksheet = workbook.add_worksheet()
    with open(csvfile, 'rt', encoding='utf8') as f:
        reader = csv.reader(f)
        for r, row in enumerate(reader):
            for c, col in enumerate(row):
                worksheet.write(r, c, col)
    workbook.close()

仅供参考,还有一个名为 openpyxl 的包,可以读取/写入 Excel 2007 xlsx/xlsm 文件。

希望对您有所帮助。

【讨论】:

感谢这个非常有用的代码 sn-p。在使用大文件时,最好使用“constant_memory”来控制内存使用,例如:workbook = Workbook(csvfile + '.xlsx', 'constant_memory': True)。参考:xlsxwriter.readthedocs.org/en/latest/working_with_memory.html 很好...但是,创建的 xlsx 文件中充满了所有错误的数字字段,这些字段存储为文本而不是数字... 在这里找到了数字作为文本问题的修复:***.com/questions/24971556/… 我必须添加这些行以使其适用于西欧语言 import sys reload(sys) sys.setdefaultencoding('latin-1') @MrMobileMan 最好使用 xlsxwriter 构造函数选项strings_to_numbers。例如,workbook = Workbook('output.xlsx','strings_to_numbers':True)【参考方案2】:

用我的图书馆pyexcel

 $ pip install pyexcel pyexcel-xlsx

您可以在一个命令行中完成:

from pyexcel.cookbook import merge_all_to_a_book
# import pyexcel.ext.xlsx # no longer required if you use pyexcel >= 0.2.2 
import glob


merge_all_to_a_book(glob.glob("your_csv_directory/*.csv"), "output.xlsx")

每个 csv 都有自己的工作表,名称将是它们的文件名。

【讨论】:

非常好...谢谢!我对这个投了赞成票。然而,我遇到的一个问题是,这和 xlswriter 都会创建充满错误的 xlsx,即文本字段被格式化为文本而不是数字...... 在此处找到文本问题的数字修复...***.com/questions/24971556/… 如果需要额外的格式化,可以不使用merge_all_to_a_book,使用pyexcel.Sheet,可以先用format()函数对convert float into int,再用sheet operations合并保存作为 csv。 使用 pyexcel-cli 包和 pyexcel、pyexcel-xlsx,您可以在命令行中执行此操作:$ pyexcel merge your_csv_directory/*.csv out.xlsx 真的很不错的一个chfw!非常喜欢!!【参考方案3】:

首先安装openpyxl:

pip install openpyxl

然后:

from openpyxl import Workbook
import csv


wb = Workbook()
ws = wb.active
with open('test.csv', 'r') as f:
    for row in csv.reader(f):
        ws.append(row)
wb.save('name.xlsx')

【讨论】:

【参考方案4】:

添加专门使用 pandas 库读取 .csv 文件并保存为 .xlsx 文件的答案。此示例使用pandas.read_csv (Link to docs) 和pandas.dataframe.to_excel (Link to docs)。

完全可重现的示例仅使用 numpy 生成随机数,如果您想使用自己的 .csv 文件,可以将其删除。

import pandas as pd
import numpy as np

# Creating a dataframe and saving as test.csv in current directory
df = pd.DataFrame(np.random.randn(100000, 3), columns=list('ABC'))
df.to_csv('test.csv', index = False)

# Reading in test.csv and saving as test.xlsx

df_new = pd.read_csv('test.csv')
writer = pd.ExcelWriter('test.xlsx')
df_new.to_excel(writer, index = False)
writer.save()

【讨论】:

依赖pandas里面的openpyxl 注意:这取决于您的 CSV 文件是平面文件格式。【参考方案5】:

使用 pandas 的简单两行代码解决方案

  import pandas as pd

  read_file = pd.read_csv ('File name.csv')
  read_file.to_excel ('File name.xlsx', index = None, header=True)

【讨论】:

这可能是更多的 OP 方式。【参考方案6】:

简单的 1 对 1 CSV 到 XLSX 文件转换,无需枚举/循环遍历行:

import pyexcel

sheet = pyexcel.get_sheet(file_name="myFile.csv", delimiter=",")
sheet.save_as("myFile.xlsx")

注意事项:

    我发现如果文件名真的很长(>30 个字符,不包括路径) 那么当 Excel 尝试时,生成的 XLSX 文件将引发错误 加载它。 Excel 将提供修复它所做的错误,但它 令人沮丧。 之前提供了一个很好的答案 将目录中的所有 CSV 文件合并到一个 XLSX 工作簿中, 它适合一个不同的用例,而不是仅仅尝试做一个 1 对 1 的 CSV 文件 XLSX 文件转换。

【讨论】:

简单的方法 请注意,此解决方案需要pyexcel 的插件pyexcel-xlsx【参考方案7】:

我如何使用 openpyxl lib:

import csv
from openpyxl import Workbook

def convert_csv_to_xlsx(self):
    wb = Workbook()
    sheet = wb.active

    CSV_SEPARATOR = "#"

    with open("my_file.csv") as f:
        reader = csv.reader(f)
        for r, row in enumerate(reader):
            for c, col in enumerate(row):
                for idx, val in enumerate(col.split(CSV_SEPARATOR)):
                    cell = sheet.cell(row=r+1, column=idx+1)
                    cell.value = val

    wb.save("my_file.xlsx")

【讨论】:

【参考方案8】:

有一个简单的方法

import os
import csv
import sys

from openpyxl import Workbook

reload(sys)
sys.setdefaultencoding('utf8')

if __name__ == '__main__':
    workbook = Workbook()
    worksheet = workbook.active
    with open('input.csv', 'r') as f:
        reader = csv.reader(f)
        for r, row in enumerate(reader):
            for c, col in enumerate(row):
                for idx, val in enumerate(col.split(',')):
                    cell = worksheet.cell(row=r+1, column=c+1)
                    cell.value = val
    workbook.save('output.xlsx')

【讨论】:

以上是关于Python将csv转换为xlsx的主要内容,如果未能解决你的问题,请参考以下文章

使用python将csv转换为镶木地板文件

使用 Python 将 XML 转换为 CSV

使用 python 将 JSON 转换为 CSV

使用 python 将 XLSX 正确转换为 CSV [关闭]

如何将CSV文件转换为python字典

将 .CSV 文件转换为 Python 中的列表