将 Microsoft Access 表转换为 CSV 和/或 Pandas
Posted
技术标签:
【中文标题】将 Microsoft Access 表转换为 CSV 和/或 Pandas【英文标题】:Transforming a Microsoft Access table into CSV and/or Pandas 【发布时间】:2020-08-04 19:12:42 【问题描述】:我有一个包含超过 600,000 行和 111 列的 Microsoft Access 表。我需要做的就是以 .csv 格式获取此表(以转换为 Pandas df)或直接转换为 Pandas 数据框。我尝试了以下方法:
将表格导出为 .xlsx 格式。这给了我一个包含超过 500,000 kb 数据的工作表,但是当我打开它时完全是空白的。
将数据导出为 .txt。我已经这样做了,但看起来表格中的分隔符/不一致的格式存在问题,当你到达后面的列时,这些数据会被搞砸(即,有些列在我不应该出现时都是空值)将 .txt 文件拉入 Pandas)
对 pyodbc 包有点混乱,但我已经能够主要找到有关让 Python 进入访问或通过 pyodbc 操作 Access 数据库的信息。
需要明确的是,我不想操纵或关联这个数据库,我只是想获得原始数据,这样我就可以通过我用 Python 构建的随机森林模型来运行它。如果我的任何措辞不正确/有问题,请原谅我,我在今天之前从未使用过 Access。
【问题讨论】:
【参考方案1】:也许您导出错误,您可以在此处检查:https://helpcenter.volusion.com/en/articles/424479-how-to-transfer-data-between-microsoft-access-and-your-volusion-store#:~:text=Within%20Access%2C%20select%20the%20database,the%20following%20pop%2Dup%20window。
然后使用 panda 打开它:
pd.read_csv('data.csv')
使用 panda 的 csv 的更多选项:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
【讨论】:
以上是关于将 Microsoft Access 表转换为 CSV 和/或 Pandas的主要内容,如果未能解决你的问题,请参考以下文章
Microsoft Access 数据透视表到 SQL Server 数据透视表
将 Microsoft Access 表单导出为 HTML 的工具 [关闭]
Microsoft Access 查询 - 将两个查询合并为一个