对时间序列 csv 文件使用 mongoimport 和适当的模式设计

Posted

技术标签:

【中文标题】对时间序列 csv 文件使用 mongoimport 和适当的模式设计【英文标题】:Use of mongoimport and an appropriate schema design for time series csv files 【发布时间】:2014-10-11 21:02:01 【问题描述】:

我在许多 csv 文件中有时间序列数据。格式基本上是这样的:

时间戳 |类型 yyyy-MM-dd hh:mm:ss |价值

我可以使用 mongoimport 函数轻松导入它。我使用的选项为 CSV 文件中的每个条目创建一个文档。相反,我想导入数据(使用 mongoimport)并同时将其转换为更好或更合适的时序数据架构,如本文所述

http://blog.mongodb.org/post/65517193370/schema-design-for-time-series-data-in-mongodb

推荐的方法是面向文档的设计,在一个文档中进行多个阅读。是否可以用 mongoimport 本身来做到这一点?还是先导入再转换?

【问题讨论】:

【参考方案1】:

mongoimport 只是某些数据格式的“导入器”。 作为具有该格式的源数据,您必须先导入,然后将其转换为您期望的特定模式。

【讨论】:

以上是关于对时间序列 csv 文件使用 mongoimport 和适当的模式设计的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 python 对 CSV 文件的多列进行排序?

如何使用 sklearn 对 CSV 文件中的多列进行一次热编码?

下载 csv 文件作为对 AJAX 请求的响应

MS-Access:对链接的 CSV 文件的慢查询

如何使用 csv 文件在 XSL 中构建键值对映射?

在python中按大小对csv文件进行多列排序