将 Microsoft Access 表转换为 CSV 和/或 Pandas

Posted

技术标签:

【中文标题】将 Microsoft Access 表转换为 CSV 和/或 Pandas【英文标题】:Transforming a Microsoft Access table into CSV and/or Pandas 【发布时间】:2020-08-04 19:12:42 【问题描述】:

我有一个包含超过 600,000 行和 111 列的 Microsoft Access 表。我需要做的就是以 .csv 格式获取此表(以转换为 Pandas df)或直接转换为 Pandas 数据框。我尝试了以下方法:

    将表格导出为 .xlsx 格式。这给了我一个包含超过 500,000 kb 数据的工作表,但是当我打开它时完全是空白的。

    将数据导出为 .txt。我已经这样做了,但看起来表格中的分隔符/不一致的格式存在问题,当你到达后面的列时,这些数据会被搞砸(即,有些列在我不应该出现时都是空值)将 .txt 文件拉入 Pandas)

    对 pyodbc 包有点混乱,但我已经能够主要找到有关让 Python 进入访问或通过 pyodbc 操作 Access 数据库的信息。

需要明确的是,我不想操纵或关联这个数据库,我只是想获得原始数据,这样我就可以通过我用 Python 构建的随机森林模型来运行它。如果我的任何措辞不正确/有问题,请原谅我,我在今天之前从未使用过 Access。

【问题讨论】:

【参考方案1】:

也许您导出错误,您可以在此处检查:https://helpcenter.volusion.com/en/articles/424479-how-to-transfer-data-between-microsoft-access-and-your-volusion-store#:~:text=Within%20Access%2C%20select%20the%20database,the%20following%20pop%2Dup%20window。

然后使用 panda 打开它:

pd.read_csv('data.csv')  

使用 panda 的 csv 的更多选项:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

【讨论】:

以上是关于将 Microsoft Access 表转换为 CSV 和/或 Pandas的主要内容,如果未能解决你的问题,请参考以下文章

Microsoft Access 数据透视表到 SQL Server 数据透视表

将 Microsoft Access 表单导出为 HTML 的工具 [关闭]

Microsoft Access 查询 - 将两个查询合并为一个

将 Access 交叉表查询转换为 SQL Server

如何将 pandas DataFrame 导出到 Microsoft Access?

将 access mde 从 32 位转换为 64 位