使用 RStudio 连接到本地存储的压缩 SQL 数据库并在其上运行查询

Posted

技术标签:

【中文标题】使用 RStudio 连接到本地存储的压缩 SQL 数据库并在其上运行查询【英文标题】:Use RStudio to connect to, and run queries on, a locally stored, compressed SQL databse 【发布时间】:2021-06-03 19:37:57 【问题描述】:

我正在尝试连接到两个本地存储的大型 SQL 数据库并在其上运行查询,文件扩展名如下:

filename.sql.zstd.part
filename2.sql.zstd

我的偏好是使用 Rmysql 包——但是我发现很难找到关于 a) 如何访问本地存储的 SQL 文件和 b) 如何处理 zstd 扩展的文档。

这可能是非常基本的,但非常感谢您的帮助!

【问题讨论】:

您似乎拥有在 DBMS 中生成表和数据的 SQL 代码,但在某个地方没有可使用的 DBMS 实例。根据您的操作系统和计算机“强度”(例如内存、硬盘),我通常建议使用 docker 实例来快速进行数据库工作。既然你说你想使用RMySQL,那建议你可以启动一个本地的mysql docker 容器。如果您以前从未使用过 docker 或命令行 SQL,这对您来说可能是一条陡峭的学习曲线,但从长远来看,这是值得的。祝你好运! 【参考方案1】:

您似乎无法理解文件扩展名。

文件名.sql.zstd.part

.part 通常表示您正在从 Internet 下载文件,但下载尚未完成(因此下载正在进行或已停止)

所以要从filename.sql.zstd.partfilename.sql.zstd,您需要完成下载

.zstd 表示它是一个压缩文件(以节省磁盘空间)。从filename.sql.zstdfilename.sql需要一个解压程序

所使用的压缩算法称为Zstandard,因此您需要专门针对该程序的解压缩器。在这里查看https://facebook.github.io/zstd/ 以获得这样的程序。 曾经也有一个 R 包用于此 - 但它已被存档。但你也可以下载旧版本 (https://cran.r-project.org/web/packages/zstdr/index.html)

filename.sql 实际上不是数据库。在.sql 文件中通常是用于创建/修改数据库结构的 SQL 语句。您必须安装一个数据库,例如MariaDB,然后导入此.sql 文件,以真正将文件保存在您计算机上的数据库中。然后你可以通过 R 访问这个数据库。

【讨论】:

以上是关于使用 RStudio 连接到本地存储的压缩 SQL 数据库并在其上运行查询的主要内容,如果未能解决你的问题,请参考以下文章

将 sparklyr 连接到远程 spark 连接

r [连接到Rstudio中的SQLite数据库] #R #SQLite #RStudio

使用 Rstudio windows 中的 R rJDBC 包连接到 hive(启用了 kerbero)

连接到本地 SQL Server 数据库的问题

r 将MS Access数据库连接到Windows中的R(RStudio)

如何在网络计算机上连接到 SQL Server 2017(即监听本地端口)